近年来,申请者在非参数统计理论及应用研究方面取得系列优异究成果,主要学术成就为 1.对独立数据,提出计算简单、具有相合及渐近正态性的估计方法,突破已有方法要求转换或误差分布已知的局限;对于相关数据,给出计算简单、限制少且相合及渐近正态的估计方法;将转换模型引入ROC曲线的研究,并给出计算简单且有效的极大似然估计方法; 2.给出生存数据的效应函数估计,性质等同于真实子模型下的性质; 引入经验似然置信区间估计偏态截尾数据,显著提高覆盖精度; 3.首次给出当个体信息无法被完全观察到或观察有误时总体大小的估计;给出当延迟分布和事件发生数函数都未知时事件数的估计,突破已有方法要求延迟报告分布或事件数函数至少一个已知的局限,实际效果很好;首次给出有弹性且精确的多渠道总体大小估计。 上述估计都被证明具有相合及渐近正态性。
non-/semi- parametric estimation;efficient nonparametric estimation;transformation model;computation complexity;combination of mixed data
本项目主要研究了非参数及半参数转换模型及有效的非参数估计,前一方面侧重非参数及半参数模型的应用,后者着重非参数估计的理论研究。 1. 非参数及半参数转换模型的理论及应用研究。 非参数及半参数转换模型是分析变量之间复杂关系的一个有力工具。 特别, 作用在结果变量上的一个合适转换可简化结果变量与风险因素之间的关系,导致同质且对称的分布,并因此得到有效及稳定的估计结果。但是, 由于目标函数不光滑,文献中主要用随机搜索方法估计非参数及半参数转换模型。 当风险因素的维数较高时,搜索方法的计算是一个很大问题。 另一方面, 现有文献主要研究单个结果变量与风险因素之间的关系,但在实际问题中,很多结果多维度呈现,且各维度的类型不同。 现有文献以特定方式合成这些多维度变量,有较大的主观及随意性。不恰当的合成方式会导致无效甚至错误的估计结果。 本项目研究非参数及半参数转换模型的快速及有效的计算方法,并证明快速计算结果与现有的随机搜索方法的计算结果等价。同时研究如何基于数据本身合成混合多维度变量,从而有效地估计和推断风险因素的影响。 2.有效非参数估计。 非参数方法因对数据的限制较少,已广泛应用于各种复杂结构下的数据分析。目前我们已知有效的参数方法(即最优参数方法)是极大似然估计。由于非参数估计的复杂性,研究有效非参数估计的文献很少(Chen et al. 2010,JASA; Chen et al. 2012,Biometrika)。 Chen et al. (2012)也提到几乎不可能找到一种方法可一致有效地估计所有的非参数模型。 本项目给出了三类非参数模型下的半参数有效估计,即最优非参数估计。