回归模型分析是统计学和数据处理分析的核心,基于参数回归模型得到的估计量通常会比非参数回归模型得到的估计量精确,而半参数回归模型,诸如半参数线性模型,变系数模型,半参数变系数部分线性模型等,则拥有线性模型和非参数模型的优点,其研究受到了人们的广泛关注。稳健统计推断一直是统计学中一个很重要的研究领域,人们对线性回归和非参数回归模型的稳健方法已进行过大量研究,而对于半参数回归模型,特别是对于半参数变系数部分线性模型的稳健统计推断的研究似乎很少。本项目将围绕上述若干统计模型中的参数、非参数估计新的稳健统计和数据分析方法开展研究工作,主要包括稳健估计方法(如M方法、分位回归、秩回归、峰值回归)、估计量的渐近性质、稳健性和有效性讨论、统计检验和实际应用。本项目所提出新的稳健统计方法不仅发展了现有稳健统计理论和方法,而且在实际应用中具有重要意义。
Flexible statistical model;Robust statistical method;Variable selection;Ultrahigh-Dimension data;Estimation and Test
本项目围绕若干灵活统计模型中的参数、非参数估计、新的稳健统计、变量选择和数据分析方法开展研究工作,所获得的主要成果包括 1. 开展了半参数稳健混合分位点回归、异方差单指标半参数模型的分位点回归、超高维分位点回归、混合效应模型、带有高维线性协变量的部分线性模型等统计灵活模型的研究,为相应的灵活模型提出了一种新的估计方法和变量选择方法,尤其是稳健估计方法,获得了估计量的渐近正态性以及变量筛选的Oracle性质;着重研究和获得了这些新方法在高维和超高维情形下的优良稳健和大样本性质(包括相合性、正态性和Oracle性质),并进行了大量的模拟和实证研究。 2. 提出了新的Feature Screening快速降维方法,该方法适用于超高维的数据,同时不需要假设回归模型的结构,其方法可直接应用到许多灵活的统计回归模型,其中之一就是基于DC-相关系数,它适用于超高维自变量,多元响应变量的数据,同时不需要假设回归模型的结构,比已有的方法更有效。 3. 获得了传统线性模型中的F-检验统计量在高维协变量情形下的渐近行为,在维数随着样本大小同阶变化的情形下,其标准化F-统计量渐近服从正态分布,但其功效阶只有n^(-1/4);提出了新的高维协方差阵结构的广义似然比检验方法。 4. 提出了一种新的方法用来提高局部线性最小二乘在纵向数据的有效性; 给出了一整套多元变系数模型的统计推断方法以及一个模型稳健单指标;提出了带有噪音(误差)变量的非线性回归参数的去噪估计及其去噪稳健估计,获得了估计的理想的大样本性质等。 5. 提出了半参数估计方程的经验似然统计推断方法,获得了传统Wilks定理成立的几乎充分必要条件,其方法适用于许多常用的灵活统计模型,具有广泛的应用范围;基于稳健的刻度截断,提出了Trimmed 和 Winsorized 变换均值的稳健估计,获得了理想的大样本性质;对于带有长记忆误差的半参数回归模型,提出了小波估计,获得了理想的大样本性质;对于Panel-Count 型数据,提出了经验似然比推断,其实用效果优良. 本项目所提出新的稳健估计和变量选择方法极大地丰富了现有稳健统计理论方法和变量选择等统计推断方法,在实际应用中具有重要意义,同时充分有效地进行了国际国内学术交流,卓有成效地培养了3名博士生和3名年轻教师,圆满地完成了项目的预期目标。