在生物医学和教育心理学及金融研究中存在大量的缺失数据、有序分类数据、非正态数据、高维数据、动态空间数据和与时间有关的数据等,本项目拟研究这些复杂数据非线性模型的统计推断及其应用。主要内容包括(1)系统研究带有不可忽略缺失数据和有序分类数据以及显变量或响应变量为非正态分布的非线性潜变量模型或半参数非线性随机效应模型、非线性广义空间或动态结构方程的参数估计及其算法;(2)研究这些复杂数据非线性模型的统计诊断、Bayes局部影响分析及模型选择等问题,提出合理的Bayes局部影响诊断统计量和模型选择准则;(3) 在不对潜变量或随机效应做任何分布假设的情况下探讨这些模型参数的半参数Bayes估计理论及其算法;(4)其理论和方法在毒品传播、艾滋病数据以及金融风险数据研究中的应用。本项目的研究内容是近代非线性统计发展需要解决的一些新课题,为研究艾滋病传播和规避金融风险等提供科学的决策理论和方法。
Missing data;Bayes local influence analysis;semiparametric Bayes estimator;Generalized spatial NSEM;Model selection
在生物医学和教育心理学及金融学研究中存在大量的缺失数据、有序分类数据、非正态数据、动态空间数据和与时间有关的数据等,如何对这些复杂数据进行统计分析是目前国内外统计学界研究的热点课题之一。本项目对复杂数据非线性模型进行了系统研究,全面完成了项目计划书中拟定的各项研究任务,并取得了以下主要研究成果(1) 对带有不可忽略缺失数据的半参数非正态非线性模型,基于MCMC算法、MH抽样技术和光滑样条技术从Bayes角度提出了选缺失数据机制模型、光滑样条的次数的CPO方法和Bayes因子的路径抽样方法并给出其计算的简洁公式;(2) 对随机效应在不做任何分布假设的情况下,通过用Dirichlet先验去近似随机效应的分布发展了能同时获得带有不可忽略缺失数据的非正态非线性随机效应模型参数和随机效应的Bayes估计的半参数Bayes方法;(3) 对缺失数据非线性模型,基于经验似然方法讨论了模型参数的经验似然估计并证明了其估计量的相合性和渐近正态性;(4) 对一般的缺失数据非线性模型,从Bayes角度提出了能同时识别数据集中的影响点、错误指定抽样分布和先验分布错误的局部影响分析方法,并讨论了这一方法在不同的缺失数据非线性模型(包括带有不可忽略缺失数据和有序分类数据的非正态非线性结构方程模型、生存数据、再生散度非线性混合效应模型等)中的应用并取得了很好的效果,将Cook(1986)的局部影响分析方法推广和发展到了Baye框架;(5) 对一般的缺失数据非线性模型,基于数据删除法从Bayes角度提出了识别数据集中的影响点的诊断统计量并给出了计算其诊断统计量的一阶近似公式,并讨论了这一方法在不同缺失数据非线性模型中的具体应用;(6) 对带有不可忽略缺失数据的估计方程,基于缺失数据的半参数Logistic回归模型发展了其经验似然估计方法并建立了其参数估计理论,推广和发展了带有MAR缺失数据机制的估计方程的相应理论;(7) 在国内外学术刊物发表或待发论文36篇,其中,SCI收录23篇、EI收录2篇,参加学术会议16人次,培养毕业博士生2名,硕士生16名;举办国际学术会议1次,国内学术会议2次;获云南省自然科学二等奖1项,国家统计局优秀成果二等奖3项;获省级优秀博士论文1篇、优秀硕士论文1篇;1人获国家杰出青年科学基金,1人获“云南省中青年学术和技术带头人”称号。