收集数据时,经常会发现生存数据的失效类型未知,即缺失了。在随机缺失的假定下,关于生存数据的研究,相关文献比较多。但随机缺失的假定在实际中经常不成立,这时应用基于随机缺失假定的方法会导致错误的统计分析结果。本项目拟在失效类型非随机缺失的(即不可忽略的缺失)情况下,研究生存数据的估计和检验问题。数据不可忽略的缺失时的统计问题的解决非常困难,一般认为相关的生存时间的函数是不可识别的,从而是不可估的。本项目拟利用失效类型为离散变量的特点,利用概率拆分和拟似然估计方法估计出响应概率函数,在此基础上对缺失机制进行检验,对生存函数和失效率函数给出非参数估计,并对半参数模型(COX模型和可加危险模型等)的估计和检验问题展开研究;并对一组生存样本是否来自某一总体及两组生存样本的失效率函数是否有差异进行检验。本项目的研究在理论上有较大创新,研究成果可以应用于很多研究领域,具有比较重要的意义。
censoring indicator missing;random right censorship;Nonignorable Missing;missing at random;survival function
失效类型未知时生存数据的研究是一个重要的研究课题。本项目完成了如下工作: (1)在随机右删失条件下当失效类型不可忽略的缺失时研究了生存函数的调整的插补估计首先提出拟似然方法估计参数概率模型中的参数,证明了参数估计的渐近正态性。在不可忽略的缺失机制下,一般的插补方法会导致一个偏差,对偏差进行矫正之后我们提出生存函数的一个调整的插补估计,证明了这个估计收敛到一个高斯过程,数值模拟研究了所提估计和文献中所提的生存函数的平均积分二次误差(MISE),在不可忽略的缺失机制下,所提的调整的插补估计具有比文献中所提的估计更小的平均积分二次误差(MISE);(2)对缺失机制是随机缺失还是不可忽略的缺失的检验问题进行了研究第一项工作表明在随机缺失机制下,本项目第一项工作所提的生存函数的调整的插补估计的平均积分二次误差(MISE)比文献Wang等(2009)所提估计的效果稍微差一些。因此有必要验证缺失机制是随机缺失的还是不可忽略的缺失的。本项目的第二项工作对这个问题提出了基于经验过程的检验方法。给出了检验统计量在零假设的分布,并用重抽样方法给出检验的临界值;并用数值模拟方法验证了检验方法的经验水平和经验功效;(3)对乘积概率模型提出了基于经验过程的检验方法第一项工作中在估计未知参数时需要乘积概率模型是正确的,否则给出的参数的估计是有偏的。因此乘积概率模型的假定是否正确也是非常关键的。我们参考文献中Dikta等(2006)估计参数模型的方法给出估计乘积概率模型的方法,给出检验统计量的渐近性质。(4)完成了随机右删失模型当删失指示变量不可忽略的缺失时失效率函数的估计问题对于失效率函数的估计,对C_C估计以及文献中基于随机缺失机制下提出的插补、回归及逆概率加权估计进行校正和纠偏得到失效率函数的四个估计,研究估计的一致相合性和渐近正态性;(5)当删失指示变量不可忽略的缺失时,提出了生存函数的一个改进的更加简单有效的估计第一项工作中提出了生存函数的调整的插补估计上标非常复杂,出现多个估计项。我们提出2个结构更加简单的估计,因为不涉及过多的估计项,数值模拟结果很好。