本课题组已经成功完成了对银屑病,系统性红斑狼疮,麻风,白癜风,特应性皮炎和食管癌患者的全基因关联分析,建立了覆盖62 万个SNP 的8494个体的分型数据库。由于MHC区域里的SNP具有很强的连锁不平衡(Linkage Disequilibrium, LD)关系,所以确定疾病易感基因的真正关联信号是一个科学难题。基于此,本课题组拟探索并发展一种新的数据分析思路,把SNP信号与经典HLA等位基因联系起来,以期能发现MHC区域的真正关联信号,改变MHC区域易感基因研究无从下手的局面。并应用此方法对上述复杂疾病MHC区域进行易感基因搜寻,并在不同人群/人种中经行验证,筛选出更多的疾病易感基因,为阐明疾病的发病机制、风险预测和诊断治疗提供依据,为今后研究MHC区域内的易感基因提供基础。
MHC;Genome wide association study;susceptibility gene;data analysis;
HLA是目前已知的具有最复杂多态性的人类基因系统,且免疫应答基因多位于HLA复合体内。经典HLA等位基因与自身免疫病的关联密切。近年来,通过全基因关联分析搜寻近百种复杂疾病的易感基因,发现近300个于疾病相关的位点,其中包括以前没有检测到的与疾病密切相关的基因及部分未知基因位于MHC区域或非MHC区域。然而,MHC区域里的SNP具有很强的连锁不平衡,即使在MHC区域发现关联信号,也很难确定此区域里真正的关联基因。鉴于MHC区域在疾病发生发展过程中的重要作用,人们不可避免地需要确定MHC区域的疾病易感基因。只有利用更为有效的统计学分析方法才能解决相关的难题,Imputation法是以HapMap人群为参考人群,用SNP的基因分型数据推演经典HLA等位基因的信息,并做关联分析和logistic回归分析的新的统计学方法。该方法建立在已分型的SNP基础上,不需要重新做实验,有效节约时间和经费成本,精确率很高。在这个项目的资助下,我们通过Imputation的方法对自身免疫性疾病,如白癜风、侧索肌萎缩硬化症、SLE、瘢痕疙瘩的MHC区域易感基因搜寻研究中取得了很大的成就。对侧索肌萎缩硬化症的GWAS研究中,通过多重检验分析以及Imputation的方法,发现2个与ALS相关的易感位点;对白癜风的遗传学研究发现MHC区域的变异与白癜风表型之间的关系;在本课题的资助下,对SLE的Meta分析发现与疾病相关的易感位点或基因,发现相关的遗传变异与SLE亚型之间的关系以及致病通路中基因间的相互作用;在分析疤痕疙瘩与HLA相关性研究中,发现HLA区域与疾病相关的单倍型;此方法应用于复杂疾病GWAS研究中MHC区域和非MHC区域,并成功鉴定出与疾病相关联的信号。本项目的开展,对复杂疾病全基因组关联分析研究数据分析具有重要意义,是其分析方法的重要补充。在完善搜寻的易感基因起着积极的推动作用,进而为将来的疾病的临床诊断、治疗、预防及风险预测奠定坚实的理论基础。