根据肿瘤患者的临床观测数据对治疗或干预的效果做出评价具有重要的参考价值和实际意义。但是由于观测数据不是来自严格的随机化临床试验,各个处理和对照组之间的协变量往往会有较大的不均衡性,这种不均衡性会导致处理效果估计的偏倚。传统的线性回归方法难以消除这种偏倚。倾向指数法从揭示处理分配和潜在的混杂因素之间的关系入手,可以较好地消除由协变量引起的偏倚。然而倾向指数作为一种平衡偏倚的新方法,目前还存在诸多尚未解决的问题。本研究拟从肿瘤患者的临床观测数据入手,将多分类Logistic回归模型应用于多组数据倾向指数的计算,探索通过倾向指数平衡组间混杂因素、对处理效应及患者预后做出正确评价的方法,旨在为临床医生制定正确的治疗方案提供参考,进而为肿瘤患者能够得到及时有效的治疗奠定基础。本研究同时探索通用的多治疗组间数据匹配的方法,拟为今后倾向指数法在观察性数据中的实际应用探索出一套可行的方案。
covariates;tumor;clinical observational data;propensity score;matching
来自肿瘤医院的临床观测数据蕴含着丰富的信息,根据这些数据对治疗或干预的效果做出评价具有重要的参考价值和现实意义。本研究从肿瘤医院收集了大量的肿瘤患者临床观测数据,完成了对患者3-5年的随访,获得了患者的预后情况。根据观测和随访数据,建成了按照不同属性分类的肿瘤患者临床观测数据数据库。再选择其中的某种肿瘤患者,按照不同的治疗方案进行分组,对处理和对照组之间协变量的均衡性进行了探索,发现不同处理组间协变量的不均衡性较为严重,这种不均衡性主要源于临床治疗的非随机化。如果不加以纠正,就会产生混杂因素,导致处理效果估计的偏倚。本研究采用倾向指数方法,借助Logistic回归模型,利用匹配和分层等功能对组间协变量的不均衡性进行了校正,采用COX回归和Logrank检验等生存分析方法对患者的生存率进行了分析,对治疗或干预的效果做出了正确的评价。