上位性是指不同座位的非等位基因之间的相互作用。已有研究表明,上位性是复杂性状遗传表达、杂种优势形成以及物种进化的重要基础之一。尽管国际上现已发展出一些专用的上位性基因定位的统计分析方法,然而,这些方法均假定研究性状是呈连续分布的数量性状。实际上,在动植物以及人类群体均普遍存在一类由多基因和环境共同控制、但表现型呈间断分布的复杂性状-阈性状。目前,已建立单个阈性状QTL分析以及多个相关阈性状QTL联合分析的统计方法,但如何定位阈性状遗传体系中可能存在的上位性基因至今仍是一国际难题。为此,本项目拟发展一套专用于单一作图群体以及多个相关作图群体阈性状上位性基因定位的贝叶斯分析方法。在此基础上,用计算机模拟数据验证方法的可行性,并以实际资料演示分析程序。本项目的完成既可为解析复杂性状的遗传结构提供技术支持,又有助于推动贝叶斯统计遗传学和统计基因组学在我国的进一步发展。
Threshold Traits;Genes with Epistasis;Bayesian Statistics;Markov Chain Monte Carlo;
本项目根据Wright的阈模型理论,导出了liability以及阈值的后验分布,以先前提出的单个阈性状QTL分析以及多个相关阈性状QTL联合分析的统计方法,在计算上,采用MCMC的高效算法和贝叶斯变数选择的最优方法,完成了单一作图群体阈性状上位性QTL作图的贝叶斯统计方法,并推广到了多个作图群体的联合作图方法,建立了F2群体两对等位基因控制的阈性状上位性基因模型,对F2的标记基因型进行关联分析,无偏地估计了QTL主效和所有4种类型的上位性效应;利用经验贝叶斯方法同时对全基因组上所有标记进行分析,检测了QTL加性、显性和复合上位性效应,完成了计算机模拟研究,验证了方法的可行性。模拟研究结果表明所定义的遗传参数(QTL主效和复合上位性效应)能够被正确地识别,QTL检测的统计功效高,所估计的QTL效应和位置具有较高的准确性和精确度。复合上位性效应的统计功效极大地受纯上位性效应的影响,主效和上位性效应的完全剖分要求较大的样本量和一定的重复。同时将该方法扩展到了基于BC群体的混合模型定位多个阈性状上位性基因的贝叶斯作图方法,以南通通州人群的流行病调查为例的影响人类疾病(阈性状)的上位性基因的贝叶斯作图方法,模拟验证了方法的可行性,将进一步通过实例验证。在上述方法的基础上,本项目利用贝叶斯统计学中贝叶斯后验概率对遗传学或分子生物学数据进行分类(包括缺失数据和分类阈性状数据),建立可用于阈性状遗传学分析的贝叶斯统计分析方法,已有模拟研究表明,缺值替代法具有较好的收敛性,对有缺失的数据基本都可正确地聚类。结合现有领域研究背景,应用MCMC的高效算法发展了检验医学中测量不确定度评定的MCM法,解决多元共线性问题的PS方法,以及单个率的Meta分析方法,这些方法均通过计算机编程实现,并模拟研究验证了方法的可行性,应用于实例研究,体现了方法的优越性。另外,在该项目的资助下,我们完成了30多篇生物统计学方法在医学领域的应用研究。如基于染色体片段代换系的复杂性状Bin模型的构建与分析策略;多态位点rs11614913与癌症易感性关系Meta分析等等。已在SCI源刊物上发表论文1篇,待刊SCI短篇报道1篇,在中文权威或核心期刊发表论文36篇,省级以上期刊发表论文4篇,2篇SCI论文已完成,准备投稿,另与本研究内容密切相关的1篇SCI论文正在进一步完善中。