位置:成果数据库 > 期刊 > 期刊详情页
基于二次打断IPedDNA片段ChIP-Seq的模拟分析
  • ISSN号:0023-074X
  • 期刊名称:《科学通报》
  • 时间:0
  • 分类:TP3[自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]东南大学生物科学与医学工程学院,生物电子学国家重点实验室,南京210096
  • 相关基金:国家自然科学基金(30871393)和国家高技术研究发展计划(2006AA020702)资助项目
中文摘要:

ChIP-Seq是在全基因组水平上研究活体细胞中蛋白质和DNA相互作用谱的有效手段.近年来,随着高通量短序列DNA测序技术的快速发展,研究基于新一代DNA测序方法的ChIP—Seq分析算法已经成为热点之一.然而,目前报道的分析方法主要是基于对免疫共沉淀获得的DNA片段进行片段大小选择后的ChiP-Seq数据,也就是主要针对Solexa系统获得的数据进行分析的算法.SOLID系统是目前测序通量最高的新一代DNA测序系统.在SOLID系统的DNA测序文库制备过程中,采用对免疫共沉淀获得的DNA片段进行二次超声打断可以满足ePCR对序列长度的要求,因此SOLID测序文库中的DNA测序片段较短.到目前为止,基于SOLID系统测序特点的ChIP-Seq研究很少报道.本文旨在研究测序文库中DNA片段的长度对ChIP-Seq分析的影响.通过真实的ChIP-seq数据和模拟产生的ChIP-Seq数据,对目前3种主要的ChIP—Seq分析方法(CisGenome,SISSRs以及MACS)的特点进行研究.有报道表明来自Solexa系统的ChiP-Seq数据局部有明显的正负链双峰特征,而通过对真实的来自SOLID系统的ChIP—Seq数据特征的挖掘,我们发现单个峰局部无明显的正负链双峰特征,并且峰的局部的序列分布大部分符合正态分布.基于这些特征,我们模拟了两个不同测序平台的ChIP-Seq实验.在控制了模拟实验的可比性后,我们发现当前基于Solexa文库制备方案的ChIP-Seq数据发展的算法,并不能有效地捕获来自SOLID系统的ChIP-Seq数据特征.我们的研究还表明,误用ChiP—seq软件可能是导致部分SOLID的ChiP—seq实验失败的原因.因此,需要开发一种新的基于二次打断IPedDNA片段的ChIP-Seq分析策略.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《科学通报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院
  • 主编:周光召
  • 地址:北京东黄城根北街16号
  • 邮编:100717
  • 邮箱:csb@scichina.org
  • 电话:010-64036120 64012686
  • 国际标准刊号:ISSN:0023-074X
  • 国内统一刊号:ISSN:11-1784/N
  • 邮发代号:80-213
  • 获奖情况:
  • 首届国家期刊奖,中国期刊方阵“双高”期刊,第三届中国出版政府奖
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:81792