统计因果推断是各种科学研究的一个重要目标。相关和因果的关系讨论历史悠久,尽管我们更关心因果关系,但统计学家得到的往往都是相关关系而不是因果关系。探讨从海量数据中挖掘因果信息,通过因果网络图探讨数据性能提高的关键因素。本项目研究的目的是研究统计因果推断的理论和方法学,同时与医学、生物信息学等领域交叉开展应用研究。本课题的学术思想是将深入地探讨从相关到因果所必需的各种关键假设和因果作用可识别的充分必要条件,研究多混杂因素的判断准则和多因素交互作用推断,探讨基于纵向研究的因果推断,研究因果网络图的学习问题,探讨缺失数据中识别因果的方法。本课题的理论意义是,用数学模型刻画因果推断所需要的假定,探讨实验研究和观察研究的本质差别,研究的理论结果可用作为生物医学领域、基因网络、计算机通讯网络中性能数据处理提供方法,通过数据的统计分析学习因果网络图,做出合理的因果解释。
英文主题词Causal inference;Confounder;Causal networks; Incomplete data