复发事件数据是在对个体重复观测中常常遇到的一类数据。对复发数据的研究热点之一是考察协变量对复发过程的各种效应,其应用已渗透到各个领域。由于数学工具的限制,目前复发数据模型集中于考察协变量对复发过程产生的线性效应和乘性效应。但是非线性效应和加性效应在实际应用中大量存在。如何克服协变量非线性效应和非参数加性效应引起的推断和证明困难,是解决处理这类数据的关键之处。本项目拟通过分析部分线性复发数据的特征,建立多种贴切实际易于推断的风险模型,如复发数据部分线性加乘模型、部分线性加速加性模型、协变量与时间有关的部分线性变换(加速)加性模型等等。通过结合传统方法与现代数学最新发展成果,充分利用和发展有效估计理论、现代经验过程理论、非参数与半参数统计方法,解决复发数据统计推断过程中的理论瓶颈问题,将之应用于Framingham心脏病例等实际数据中,进一步拓宽复发数据的理论研究思路和应用领域。
recurent data;informative censoring;spline;missing data;
复发数据具有复杂的时序性,协变量对复发数据会产生各种复杂效应影响,这些因素给复发数据建模与统计分析带来了相当大的难度。本项目对复发事件数据建立了各种切合实际的模型,对相应模型的参数和非参数提出了新的统计推断过程,建立了相应估计大样本性质的理论结果,解决了血小板输血反应、医疗消费等等实际医学研究中的若干重要问题。对有信息删失的复发数据,我们将经典Cox模型推广为多元有信息删失回归模型,提出成对伪似然方法建立估计方程,得到估计的相合性与渐近正态性;首次提出一种半参数均值模型用以刻画观察历史与协变量之间的相关性,在对回归系数和基准均值函数进行统计推断的过程中,尝试用基于样条的最小二乘估计方法加以解决;对有信息观察和删失的面板数据建立了灵活的脆性模型,并提出新的估计方法克服模型中多个非参数带来的困难。对高维协变量Cox模型,构建了一种成组Bridge罚函子,以同时选出重要组别和重要协变量,并且估计相关的协变量系数。利用KTT等条件证明了相应估计的Oracle性质。对缺失数据,我们建立了一种广泛的广义线性混合模型,其中对随机效应的分布不加限制,允许协变量缺失。通过发展成对似然估计方程得到参数的稳健估计,并证明了估计的大样本性质。此外,通过研究双无限环境中马氏链函数加权和的极限定理,得到了双无限环境中马氏链函数加权和强收敛性成立的一系列充分条件等理论结果。