"混合作图"(Admixture mapping)是利用混合人群的遗传特征进行基因定位的策略,其基本思想是寻找基因组中混合比例显著偏离的区域,与表型或疾病建立关联。这一方法无需对照样本,并在很大程度上缓解统计分析中的多重检验问题以及样本遗传结构问题。一般认为混合作图只适于近期混合人群,但我们的前期研究发现在中国的一些相对古老的混合人群中也完全具有可行性。本项目选取中国典型混合人群新疆维吾尔族作为研究对象,依据人口分布特征收集500例样本,采用DNA芯片技术,利用近百万个单核苷酸多态性(SNPs)和近百万个拷贝数变异(CNVs)探针在全基因组范围进行基因分型。通过整合公共数据库中其它群体的数据,筛选遗传标记,构建一个高分辨率的基因定位图谱,并评估图谱功效及预测所需样本量。该图谱首次针对古老混合人群,并可应用到其他类似混合人群如哈萨克族以及中亚大部分混合人群。
Admixture population;Admixture mapping;Admixture map;SNP;CNV
本项目在原计划的基础上,除了完成维吾尔族全基因组拷贝数变异图谱的构建以外,对研究内容进行了适当的扩展。一方面,研究对象上从原计划的维吾尔族人群基础上,增加了哈萨克族、柯尔克孜族、汉族和藏族4个人群;另一方面,研究内容上在原计划构建遗传变异图谱的基础上,增加了对混合人群迁徙历史和环境适应方面的研究,尤其是在方法上进行了诸多富有成效的工作,并且通过与国际同行的合作,将研究范围扩展到东南亚的混合人群。本项目的主要进展和所取得的成果如下。(1)混合人群的遗传结构分析、遗传图谱构建和复杂性状基因定位策略研究从全基因组水平揭示了汉族人群的遗传结构和大城市人群的遗传混合特征,并据此分析了复杂性状基因定位中的不同策略应该考虑的人群结构分析,同时给出了不同情况下的合理采样策略(Am J Hum Genet 2009)。利用微阵列芯片技术,构建了首个中国多民族全基因组拷贝数变异图谱(PLoS One 2011)。并通过对人类基因组中疾病相关基因的系统性分析,提出了除孟德尔遗传疾病基因和复杂疾病基因之外的“双联基因”模型,丰富了对人类疾病基因遗传模式的认识(Hum Mol Genet 2012)。(2)基因组重组信息及混合人群的迁徙历史研究发展了基于“单倍型共享”的方法,利用基因组的重组信息对人群的系统发育遗传关系进行重构(Ann Hum Genet, 2011)。探明了新疆维吾尔族是由具有高加索血统和东亚血统的祖先混合产生(Mol Biol Evol, 2009)。利用混合人群的特征和重组信息,首次从遗传学角度估计了亚太地区分布最广的人群的扩张时间(PNAS, 2012)。(3)人群的混合动力学模型和研究方法提出两种可以用来研究群体混合历史和混合动力学机制的方法(Am J Hum Genet, 2012)。(4)混合人群的环境适应研究和复杂性状相关基因的进化分析发展了基于全基因组水平检测混合人群自然选择的新方法(Genome Res 2012);通过全基因组多态性研究鉴定了藏族人群高原适应相关的基因(Mol Biol Evol 2011)以及美国黑人在人群混合之前以及混合之后的环境适应(Genome Res 2012)。以上成果也应邀总结到1篇邀请综述和1个书籍章节,以项目负责人作为通讯作者(第一署名单位)发表,均已标注该项目的基金号(30971577)。