本项目主要致力于处理高维数据的统计方法和理论的研究,它们包括变量选择,建模,统计推断和计算.在这些问题中,数据的维数和数据量均很大,现在处理一般数据的统计方法均可能会遇到一些诸如存在系统偏差,渐近分布不同和计算复杂度高等问题,这些都加大了统计建模、推断、分析和计算的难度.我们拟在高维数据的框架下,对线性模型、Tobit 模型、Logistic 模型和Probit 模型和单指标模型,从统计思想,建模,变量选择,理论和方法等方面进行研究, 提出或改进有关的统计方法,深入研究它们的渐近性质, 特别着重于渐近分布的研究.我们将发展一种新的直接的Bootstrap 和随机加权方法,不必求助于多余参数的估计.本项目的数学理论将涉及极限理论、随机分析等有关理论.这些研究可引发一连串的后续研究,具有重要的理论意义和应用前景.
英文主题词high-dimensional data; variable selection; penalized likelihood; randomly weighted bootstrap; limiting theory.