基因组学的重要进展为揭示人类进化和复杂性状的分子遗传机制提供了可能和机会。然而目前多种基因组计划的群体样本有限且多来自欧裔,对了解中国人的遗传结构参考有限,因此亟待有针对性地对中国人群开展研究,掌握国人的基因组多态特征。本项目将在参加国际HapMap及其他大型基因组计划的基础上,发挥SNP分型、数据库和生物信息平台的优势,针对若干代表性群体开展全基因组高密度SNP分析,建立基因组多态性图谱即中华HapMap及其数据库,并构建包含拷贝数和倒位多态的人群结构多态图谱、自然选择图谱和相关分子标记。通过在扩大样品中对若干性状的关联分析和遗传地理分析,以及基因网络和功能模块的分析验证等群体基因组学和生物信息手段,挖掘人群特征性多态的生物学意义,了解中国人遗传背景的形成基础。最终整合能代表上述遗传多态性的多套分子标记,形成适合中国人群的遗传多态分子标记体系,为后续广泛的基因组和遗传学研究提供有效工具。
SNP;structural variation;copy number variation;population;molecular markers
本项目基于人类基因组多态性及其分子标记立项。研究计划分为三个方面揭示中国人群的基因组多态构成和特点、人群演化及其功能影响的相关性。第一方面为中国若干人群基因组多态性组成研究。主要通过基于SNP分型的全基因组多态位点分析和新一代测序解析若干中国人群的遗传多态,包括汉、藏、维吾尔、黎、傣族等的常见和罕见SNPs,单体型和结构多态以及人群特异的地理分布。着重研究了藏族人群的基因组背景和低氧适应遗传基础,维吾尔和海南黎族的遗传特征,以及汉族的novel SNPs以及多态标记的地理分布。发现了EPAS1和EGLN1是藏族高原低氧适受到强选择的基因及其可能机制或线索,确定了维吾尔族基因组背景和人群形成的遗传模式。构建了中国人群的结构变异图谱与分子标记,并详细剖析了结构多态的形成特点和人群与地理的分布机制。同时,研发了多种基于二代测序的分析SNP和结构多态的算法软件。第二方面为功能性分子标记及复杂表型相关研究。针对多种生理体质、复杂性疾病与肿瘤的相关性状在若干个中国人群中进行了全基因组或候选基因的关联分析及其验证研究,并详细分析刻画了若干基因的人群演化与自然选择模式,确定了多种生理或疾病等复杂表型的功能性分子遗传标记和人群选择信号。同时,研发了筛查自然选择信号和多种分析研究复杂性状的genotype的程序软件。第三为基因组多态与功能的网络和系统性研究。利用基因表达、表观遗传数据和分子遗传标记位点,针对若干疾病或生物过程构建了分子和信号网络并进行了相关方法学研究,揭示了生物过程调控相关的分子机制,包括儿童急性淋巴细胞白血病基因分型模型和调控网络预测和大脑衰老过程的表观调控等。同时,提出了疾病相关基因变异的“双联基因”模型和合作建立了我国最大的人群健康追踪调查基地泰州队列。项目总体执行顺利,各课题组均取得大量重要成果和阶段性进展并构建了大量数据库和数据集,在完成计划的基础上有大量超额完成的探索研究。项目的大量科研结果是了解我国的人群特异遗传结构和基因组多态对于表型和疾病的影响的重要基础。