全基因组关联研究(genome-wide association studies,GWAS)是在全基因组范围内同时研究上百万个单核苷酸多态性(single nucleotide polymorphism,SNP)位点与疾病或某些性状之间的关联,从而筛选出可能的致病SNP位点,进而对这些位点进行人群验证和实验分析。在GWAS研究中比较传统的分析方法是针对每个SNP和结局变量间关联进行单因素分析的假设检验,而待分析的SNP数量有几十万甚至上百万个,使得检验次数十分巨大,如果不采用合适的方法进行多重性校正来妥善控制Ⅰ类错误,会产生许多假阳性结果,对这些结果进行验证将耗费很多时间和财力,造成不必要的损失。针对全基因组测序数据进行多因素建模常采用的分析策略为降维和变量选择。