线性回归模型中自变量相对重要性估计是医学现场与实验研究资料回归分析中的首要任务之一。国际上目前正在研究和建议的方法主要有乘积尺度、优势分析、比例边界方差分解和相对权重四种方法,但对方法的前提条件(期望准则)、理论基础和方法本身有较大争议。本项目主要研究(1)引进自变量相对重要性估计的四种方法,开发相应计算程序;(2)在对自变量相互间各种可能关系构建的基础上,建立统一的四种方法前提条件(期望准则),建立四种估计方法间数理上关系,摸拟试验评价和比较四种估计方法,提出推荐方法建议;(3)在研究对策理论的Shapley值与线性回归模型自变量相对重要性估计的同构性的基础上,建立基于Shapley值的自变量相对重要性估计方法;(4)应用bootstrap法和摸拟试验研究估计指标的抽样分布,建立可信区间估计与显著性检验方法。将建议方法和新建立的自变量相对重要性估计方法应用实际资料分析。
the linear regression model;relative importance of variables;dominance analysis;relative weight;simulation results
项目的背景线性回归模型中自变量相对重要性估计是医学现场与实验研究资料回归分析中的首要任务之一。国际上目前正在研究和建议的方法主要有乘积尺度、优势分析、比例边界方差分解和相对权重四种方法,但对方法的前提条件(期望准则)、理论基础和方法本身有较大争议。主要研究内容(1)引进上述建议四种线性回归模型自变量相对重要性估计方法,在SAS等软件中开发或自编相应的计算程序,并用实例进行验证;应用bootstrap法和摸拟试验研究估计指标的抽样分布,建立可信区间估计与显著性检验方法。(2)运用Monte Carlo摸拟研究方法对四种方法相互间的关系进行比较评价,提出建议方法。(3)在研究对策理论的Shapley值与线性回归模型自变量相对重要性估计的同构性的基础上,建立基于Shapley值的自变量相对重要性估计方法;重要结果将上述四种方法的程序并用实际案例进行验证,发现乘积尺度、优势分析、PMVD法和相对权重四个方法,四种方法构建时前提条件(期望准则)有所不同,理论基础各不相同,对实际资料分析结果也各不同,但其中优势分析与相对权重的估计结果十分接近。应用bootstrap法和摸拟试验研究估计指标的抽样分布,建立可信区间估计与显著性检验方法,结果提示优势分析和相对权重方法对自变量重要性估计最优。后运用Monte Carlo摸拟研究方法对四种方法相互间的关系进行比较评价,提出自变量相对重要性的建议方法为优势分析方法。研究对策理论的Shapley值与线性回归模型自变量相对重要性估计的同构性,建立基于Shapley值的自变量相对重要性估计方法。科学意义将国际上近十多年研究发展通过本项目研究引入国内并开发新的估计方法,应用于医学学科研究中,避免使用标准回归系数等多个公认不恰当的单指标估计方法,促进医学学科中事物关系研究的进步;对多学科尤其是医学学科中符合线性模型关系的(暴露、危险)因素、特征和属性的重要性和位次做出估计,对深入研究内在的机制和采取防治措施和策略具有重要的意义;所建立的方法和技术对Logistic回归模型、Cox回归模型和Poisson回归模型。