DNA甲基化是表观遗传学的重要组成部分,对于胚胎发育,人类衰老,肿瘤发生等起着非常重要的作用。第二代测序技术的兴起,为DNA甲基化研究提供了广阔的研究前景。但目前第二代测序技术在DNA甲基化领域的应用仍存在测序数据无法准确全面获得这一基本问题没有解决的困难。本项目意在根据不同第二代测序仪测序原理的不同和获得的短序列涵盖内容的不同,改变前人固有比对思路,采用新的方法和比对策略,修改现有普通比对软件,解决目前经重亚硫酸盐处理SOLiD测序的reads难以比对到基因组这一基本问题无法解决的困难;解决已有Solexa测序reads比对到基因组的结果假阳性过高的问题;建立一套完整的DNA甲基化测序数据分析流程,并构建成网络服务器。网络服务器将支持多种不同实验、基于不同原理的测序数据的分析,包含注释甲基化的胞嘧啶在染色体上的分布,在特定的CpG岛的分布和表达, 甲基化的CpG岛所在基因的表达差异等等。
DNA methylation;bisulfite sequencing;alingment method;web server;
本项目的主要研究围绕着重亚硫酸盐测序数据的处理、比对、分析方法以及方法的应用展开。主要的成果1. 开发了Illumina测序的重亚硫酸盐修饰的DNA短序列数据比对基因组的方法。此方法支持paired-end和single-end数据,支持RRBS和WGBS两种实验类型的数据。在比对效率和比对精度上均优于现有重亚硫酸盐数据比对软件。2. 构建完成了重亚硫酸盐测序的数据处理分析网络服务器WBSA,WBSA支持WGBS和RRBS数据的质量分析、预处理、比对、注释和分析;支持差异甲基化区域识别;支持甲基化与基因表达关系分析;WBSA不仅关注CpG位点,同时也关注non-CG位点,适用于动物和植物的DNA甲基化研究。WBSA有在线版和本地版两个版本,并且提供PBS作业管理系统版和单机版的集成软件。3. 应用WBSA流程,首次提出了全基因组重亚硫酸盐测序的单碱基分辨精度的家鸡肺组织DNA甲基化组。差异DNA甲基化区域(DMR)分析表明Leghorn和Fayoumi鸡的许多DMR相关基因被富集在与免疫相关的通路上,这表明DNA甲基化能够调节鸡的病原体感染的宿主免疫应答,在这一点上表现出Leghorn和Fayoumi对于一些病原体有不同的抵抗力。