正选择是造成生物多样性的重要进化机制之一。然而正选择和群体数量变化都可以使遗传多态数据偏离中性进化模型的预期,从而造成正选择检测结果的假阳性。这也是为什么在现代人群全基因组扫描中,不同研究者检测到的候选基因经常不一致的一个主要原因。为解决这一理论问题,我们新近发表了一个新的分析策略用以在单个遗传座位上检测正选择。我们证明了新的统计学检验不受种群历史等因素的干扰,并且有效性高达90%以上。在这一研究中,我们将把这一检测策略通过最大似然法加以扩展为基于多个遗传座位的方法,用来分析在千人基因组计划中所公开的以汉族为代表的中国人群的全基因组多态数据,检测在中国人群中新近受到适应性进化影响的基因,并对候选区间加以实验验证。此项研究不但将进一步解决检测正选择时存在高假阳性这一世界性难题,进一步了解中国人群的适应性进化机制,而且将为许多研究组在微进化水平上检测适应性进化提供一个可靠的分析方法和分析软件。
positive selection;recombination rate;population genetics;;
我们在这一项目中,围绕着如何可靠检测正选择这一核心内容进行了两部分的研究1) 首先我们对人类适应性进化的一类极为重要的模型,即基于配子竞争的选择模型进行了数学分析,并得到了相应的解析解。并且围绕着如何利用人群中微卫星DNA的多态数据和SNPs来检测正选择发展了两个可靠的检测方法,并用来分析现代人群的适应性进化。2) 其次在检测正选择的过程中,准确、快速地估计群体的遗传重组率(4Nr)是极为关键的。为此我们发展出了一个新的方法,可以相当快速地估计群体的遗传重组率,并且准确度和其他方法相比是同样准确的。我们的新方法比牛津大学开发的、目前最常用的软件(LDhat)足足快了10万倍,并且精确度是一样的。目前我们正在分析不同人群的遗传重组热点。