基因组序列变异是生物进化和适应环境的必然结果。不论基因变异发生在编码区还是非编码区都可能导致基因功能的改变,并最终影响生物体的表现型。作物的重要表现型多为数量性状,常受多个基因控制,而每一基因在品种间又可能存在多种序列的差异,因此,如何确定哪些位点上的序列变异与数量性状有关,以及同一位点上不同序列变异的功能差异,仍是一大挑战。本项目拟从统计基因组学的角度,建立对目标性状候选基因序列变异功能差异进行统计鉴别和效应估计的方法与程序,并通过计算机模拟数据验证方法和程序的可行性。在此基础上,以前期构建的一个玉米自交系自然群体为材料,通过对涉及玉米籽粒淀粉合成相关的20个候选基因的实际测序,研究该群体相关基因的序列变异及其与玉米籽粒淀粉含量、直支链淀粉比例、RVA以及DSC等品质指标的关联,筛选出候选基因的重要变异位点,并估计其对表型的效应及贡献率,以便为玉米自交系的遗传改良和分子设计提供技术支撑。
maize candidate genes;allelic variation;statistical approaches to genomics;yield traits;quality traits
作物品种间存在大量的基因序列变异。不论这些变异发生在编码区还是非编码区都可能导致基因功能的改变,并最终影响作物品种的表现型。如何确定哪些位点上的序列变异与目标性状有关,以及同一位点上不同序列变异的功能差异,仍是一大挑战。本项目在理论上,首先应用统计基因组学方法,建立了对单一目标性状候选基因序列变异功能差异进行统计鉴别和效应估计的方法与程序,并通过计算机模拟数据验证了方法和程序的有效性。在此基础上,进一步将该方法推广应用于多个相关目标性状的联合关联分析以及联合表型预测。模拟研究发现,多性状联合关联分析不仅可以提高基因的被发现能力,而且有助于提高基因效应估计的准确度和精确度。利用多性状的相关信息进行目标性状表现型的预测可以显著提高目标性状的预测能力。在上述研究方法的基础上,以前期构建的一个包括103个来源广泛的玉米自交系在内的自然群体为材料,通过对涉及玉米产量和品质相关的72个候选基因的序列定点捕获和测序,获得了各个候选基因在自交系间的序列变异位点,进一步结合玉米产量相关的株高、穗位高、穗行数、穗粒数、粒重等12个性状以及籽粒淀粉品质相关的淀粉快速粘度参数RVA与热力学参数DSC等11个性状的实际测定结果,进行了玉米产量和品质相关性状候选基因的序列演变分析以及与目标性状的关联分析,筛选出候选基因的多个优异变异位点,并发展出相应的功能分子标记。研究结果为玉米自交系产量和品质相关性状的遗传改良与分子设计提供了重要参考。通过研究工作的开展,培养博士后1人,博士研究生4人,硕士研究生2人。在Plant Physiology、Molecular Breeding、Plant Molecular Biology Report、Crop Science、Heredity等SCI刊物上发表论文12篇,另在《作物学报》和《The Crop Journal》上各发表论文1篇。