本项目研究内容有两个方面。一个是关于病例对照数据用于预期研究模型中所产生的问题研究 。另一个是关于癌症早期预测中的统计方法研究。医学研究中存在两种不同的数据采集方式,预期研究和病例对照。人们往往利用病例对照方式采集数据,但却将其用于预期研究模型估计参数。本项目拟研究由此产生的若干问题。基于CA125和HE4等多种生物标记物,根据病例对照数据和纵向观测数据,研究探讨癌症的早期诊断所适用的统计模型和分析方法。以卵巢癌作为研究的出发点。早期卵巢癌治愈率可达90%以上,但70%以上患者就诊时已属晚期, 仅有不到30%的患者能存活至5年以上,可见早期诊断十分重要。CA125一直以来作为生物标记物用作卵巢癌的诊断,但灵敏度和特异度都很低。近年来发现用CA125和HE4等多个标记物共同作为诊断因素可极大提高灵敏度和特异度,我们将探讨利用病例对照数据和纵向数据综合早期诊断癌症的模型和统计分析方法。
cancer screening;longitudinal data;Hierarchical model;MCMC;two step regression
卵巢癌在我国女性生殖系统恶性肿瘤中死亡率排在首位,且其治愈率与其早期诊断之间存在很强的相关性。而在近年来对卵巢癌的早期筛查中,血清标记物 CA125及HE4是两种常用的生物学标记。故而,针对卵巢癌的早期筛查问题,基于筛查对象CA125及HE4水平的纵向检测数据,提出了一个带有变点的二元贝叶斯分层混合效应模型;之后在对模型利用MCMC抽样进行分析的基础上,提出了分别基于癌症风险计算和基于假设检验的两种针对个体的诊断方法,并最终在上述诊断方法的基础上给出了一套卵巢癌早期序贯筛查方案。本文模拟了一个跨度为7年的序贯筛查研究,并将其与通常的基于固定阳性阈值的非序贯筛查 进行对比,发现在特异度相同的前提下,该序贯筛查方案其敏感度将比非序贯筛查高出大约15%。故而,我们认为,本文提出的序贯筛查方案比通常的基于固定阈 值的非序贯筛查方案,在有效性方面具有明显的优势。有关内容的文章已被《Acta Mathematicae Applicatae Sinica》接收。Early Screening of Ovarian Cancer,Xiao Han, Chenchen Zou, Xiangzhong Fang. 进一步本文基于纵向变化水平的带变点的二元混合效应模型,在潜伏病程右删失的假设下用极大似然方估计参数,证明了其相合性,较Skates所提的Bayesian模式有相当的准确性和更广的适应性。在跨度为五年的模拟筛查里比较了基于癌症风险率和假设检验两种诊断方法的效果,模拟结果显示在提早探测基于假设检验的筛查方法更具优势。Cox比例危险率模型是医学领域中常见的一种预后模型,有广泛的应用。自D.R.COX(1972)提出这个模型以后,受到了很大的关注,此后N.Breslow,Efron, Peto, I.Hertz-Picciotto and B.Rockhill等很多的统计学家对这个模型,我们研究了两步方法。另外,对于生存分析和可靠性也有新的进展。