基因组选择是当前国际研究热点,而对于动物育种有重要意义的阈性状,国内外至今缺乏其有效的基因组育种值(gEBV)估计方法。本研究在前期研究工作的基础上,采用阈模型贝叶斯方法,运用MCMC(Markov Chain Monte Carlo)算法,进行理论和公式推导,建立估计阈性状gEBV的新方法。编程实现所提出的新方法,开发相应软件。通过计算机模拟,处理分析模拟数据,优化新方法及软件。新方法与现有连续性状gEBV估计方法处理相同阈性状数据,分析新方法的改进效果。处理分析国际QTL-MAS Workshop颁布的公共数据,与国际上开发的最新方法进行比较,进一步验证本课题开发的方法及软件的有效性。处理分析实际动物阈性状数据,为阈性状基因组选择的实施提供支持。
Genomic breeding values;Threshold traits;Bayesian methods;MCMC algorithm;Copy number variations (CNVs)
基因组育种值(gEBV)估计是基因组选择的重要环节, 基因组育种值的准确性是基因组选择成功应用的关键, 而其准确性在很大程度上取决于估计方法。目前研究和应用最多的基因组育种值估计方法是贝叶斯(Bayes)和最佳线性无偏预测(BLUP)两大类方法。本项目系统比较了目前已提出的各种Bayes方法, 并研究了该类方法的估计效果和各方面的改进。模拟数据和实际数据研究结果都表明, Bayes类方法估计基因组育种值的准确性优于BLUP类方法, 特别对于存在较大效应QTL的性状其优势更明显。由于Bayes方法的理论和计算过程相对复杂, 目前其在实际育种中的运用不如BLUP类方法普遍, 但随着快速算法的开发和计算机硬件的改进, 计算问题有望得到解决;另外, 随着对基因组和性状遗传结构研究的深入开展, 能为Bayes方法提供更为准确的先验信息, 从而使Bayes方法估计基因组育种值准确性的优势更加突出, 应用将会更加广泛。本项目的主要研究成果如下 1、本研究在前期研究工作的基础上,采用阈模型贝叶斯方法,运用MCMC(Markov Chain Monte Carlo)算法,进行理论和公式推导,建立估计阈性状gEBV的新方法。编程实现所提出的新方法,开发相应软件。并开展深入系统的模拟研究进行验证。 2、开发连续性状基因组育种值估计BayesA、BayesB、BayesC?、emBayesA和GBLUP方法的软件程序,开展方法比较研究,为基因组选择的实际应用及方法选择提供参考,为新方法的开发奠定基础,也促进了中国畜禽基因组选择计算平台建设。 3、本项目利用高密度CGH芯片技术对猪的CNV进行全基因组检测,构建了猪较为全面的基因组CNVs图谱,为深入了解猪的基因组结构及开展CNVs和重要性状的关联分析提供了提供科学依据和技术支持。 4、本项目选取产仔数呈极端高低水平的大白猪个体,采用RNA-seq技术检测其卵巢组织基因差异表达情况。本研究共获得了1243个差异表达的基因,其中897个基因在YH组上调,346个基因在YH组下调。其中大量基因与类固醇激素调节密切相关,差异基因共富集在59个GO条目和27个KEGG Pathway中,包括类固醇生物合成和卵巢甾体激素两个重要通路。从这些差异基因中,我们采用生物信息学方法鉴定出11个与高产仔数猪相关基因。