多角度观察事件会产生相应的多结果变量,各变量之间有密切的关系,但数据类型可能不同。本项目旨在提出一个系统的统计方法分析并合成数据类型变化的多结果变量。具体为(1)提出有弹性的统计框架分析各结果变量对潜在事件的影响方式及程度,产生单一指标估计并描述该潜在事件,合成多结果变量。(2)针对多结果数据可能被重复测量因而相关或聚类的问题,提出非参数正态转换联合模型,估计并推断聚类的多结果数据两种关系发生的方式及程度,分析风险因素影响各结果变量的方式及程度。(3)针对纵向的多结果数据通常中途退出,退出的原因可能与待观察的结果有关的问题,建立多重非参数正态转换联合模型,分析有信息退出的多结果纵向数据,尤其是, 分析退出原因、多结果变量之间发生关系的方式及程度、风险因素影响各结果变量的方式及程度。
nonparametric and semiparametr;transformation model;semiparametrically efficient;ROC curve;
在国家自然科学基金(11071197)的支持下,研究取得重要进展,主要包括三个方面1. 非参数及半参数转换模型的理论及应用研究对单个结果变量,提出非凹判罚平滑秩相关方法,克服了现有方法计算复杂及无法处理高维变量的缺陷;对生存及定量测量混合数据,用秩相关方法估计出风险因素的唯一效应指标;对一般的多结果变量,提出半参数潜变量转换模型,克服了现有方法需要预先给定变量间相关结构的问题,且允许各种类型的数据同时存在;用半参数线性转换模型分析因果效应,我们的模型包括因果效应分析中的两类最常用模型,有更好的适应性。2. 全局非参数估计研究对纵向数据,利用修正的Cholesky矩阵分解,将方差矩阵的估计转换成联系函数、方差函数及自回归函数的估计, 提出全局化的局部线性方法估计这些函数,克服了维数灾难问题并有很强的适应性及有效性;针对变系数比例风险模型,提出全局偏似然方法, 克服了现有方法不能直接估计截距函数及无法处理离散协变量的不足,我们的估计结果被证明是半参数有效,即该模型下的最优非参数估计。3. 非参数ROC曲线的理论及应用研究提出了联系及基结构完全未知时非参数直接ROC回归模型的估计方法,克服了现有的方法要求联系函数和基函数中至少一个已知的不足;基于ROC曲线及转换模型研究中的秩方法,找到了一种从海量的生物标的中快速选出有意义的生物标的并同时作最优合成的方法。研究成果发表于《Biometrika》(1篇)、 《Scandinavian Journal of Statistics》(1篇)、《Statistica Sinica》(2篇)、《Canadian Journal of Statistics》(3篇)、《Computational Statistics and Data Analysis》(2篇)等。 《Biometrika》为国际统计学前四刊物, 其它为国际统计学排名前10%的刊物。 三年来,组织2次国际学术会议及2次国内会议,特别是2013年的IMS-SWUFE概率统计国际研讨会,参加人数400多人,国外参会者近250人。参加31场国内外学术交流活动,邀请专家30多人次到校内做学术交流。在学校及国家自然科学基金的支持下组建了统计研究中心,有专职研究人员9名。培养硕士生14名,博士生3名。严格按照预算及财务规定执行,已用经费26.7万,剩余3.3万。