本项目拟研发一套基于新一代高通量DNA甲基化测序的整合分析软件,实现1)大规模测序短序列到参照基因组的高效比对定位;2)DNA甲基化位点的定量确定;3)不同功能区间/不同染色体/不同甲基化模式下甲基化水平定量检测;4)多样本之间差异甲基化区域的挖掘并进行深入功能注释;5)各功能模块和结果的可视化。该软件将为DNA甲基化组测序数据的有效分析提供软件保障和工具支持。此外,本项目还将利用已经获得的T29(卵巢上皮细胞)和T29H(卵巢癌上皮细胞)的甲基化组数据,测试、验证和优化开发的整合分析软件。同时,利用开发的整合分析软件在碱基水平绘制出T29-T29H全基因组DNA甲基化图谱。通过对比T29-T29H差异的DNA甲基化区域及对相关功能基因的影响,筛选一批与T29H发生癌变相关的特异甲基化区域,为进一步研究卵巢癌细胞发病的表观遗传机理及卵巢癌的临床治疗提供有力的科学依据和方案。
bisulfite sequencing;RRBS-Analyzer;Bycom;epigenetics;ovarian cancer T29-T29h
新一代测序技术的发展为基因组水平上甲基化研究提供很大的帮助,但是通过高通量测序技术产生大量的数据准确检测和量化DNA甲基化是目前甲基化研究的难题。因此,通过本项目我们开发出2款基于新一代高通量DNA甲基化测序的分析软件RRBS-Analyzer和Bycom,并应用于T29和T29H细胞甲基化组数据的分析,揭示出甲基化和卵巢癌发生的关系。整合的甲基化分析平台RRBS-Analyser可以对原始的测序数据进行质量评估,产生基本的统计信息,把质量控制之后产生的clean reads比对到参考基因组上,确定并注释甲基化胞嘧啶的位点和甲基化水平。此外,RRBS-Analyser软件支持多个物种的DNA甲基化组测序数据的分析,对于多个样品的DNA甲基化组测序数据,该软件还可以检测样品之间的差异甲基化区间。该软件对找出的DNA甲基化位点及差异甲基化区间还进行详细的基因区间注释(如外显子区、内含子区、UTR区以及启动子区等)。Bycom基于贝叶斯理论框架来精确无偏向通过测序数据检测DNA甲基化,通过公共数据中包含的大量实验验证的甲基化位点来进一步比较Bycom和二项分布检验,结果显示Bycom在高甲基化水平位点上具有较高的准确度,同时在低甲基化水平位点上保持较低的错误率。这2款软件解决了基于DNA甲基化测序数据的甲基花位点检测,量化,甲基化差异区域鉴定,以及功能注释等功能,为DNA甲基化组测序数据的有效分析提供软件保障和工具支持。通过对卵巢癌细胞系甲基化测序数据的分析发现了甲基化诱导的RRAD基因沉默在肿瘤发生发展中的作用。相关研究成果分别发表在Human Mutation (2013;34(12):1606-10), PLoS Computational Biology (2014;10(9):e1003853)和The Journal of Biological Chemistry (2014;289(20):14225-38)。