在动物全基因组关联研究中,单个SNP分析通常检测到大量显著的但作用很小的SNP,因而对复杂性状的遗传变异仅提供了有限的理解。以基因和生化或代谢路径等为分析目标,利用构成它们的SNP观测信息,能够鉴定可以解释复杂性状更大遗传变异的功能单位。引用Kolmogorov-Smirnov和Maxmean统计量来表征基因和路径对目标性状的影响,采用置换检验或重标准化方法去判定基因和路径对目标性状作用的显著性。为了降低构成基因集SNP间的共线性对分析结果的影响,并考虑SNP间的交互作用,我们又引入主成分分析方法,从大量相关和互作的SNP中提炼出较少的独立分析单元,以期提高估计基因和路径遗传作用的计算效率以及统计的准确性和可靠性。计算机模拟验证和检验新方法的有效性和适应性,并与现行方法和其他统计量进行比较。新方法将应用于一系列公开使用的人类复杂疾病全基因组数据和中国西门达尔牛屠宰性状的全基因组关联分析。
英文主题词GWAS;SNP;gene;pathway;QTL