位置:成果数据库 > 期刊 > 期刊详情页
一种具有精确边界的重复体识别算法
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]西安电子科技大学计算机学院,西安710071
  • 相关基金:本课题得到国家自然科学基金(69601003)、国家青年自然科学基金(6070500)和陕西省自然科学基金(2005F33)资助.
中文摘要:

当前大部分重复体识别算法不是依靠于已经标识的重复体数据库就是定义重复体为两个最大长度的相似序列,而没有一个严格的定义来平衡重复体的长度和频率.针对这些问题文中提出了一种基于局部序列比对算法BLAST变型且支持空位的快速识别重复体的RepeatSearcher算法.算法通过定义重复体的精确边界运用逐步扩展调和序列来识别重复体.算法使用C.briggsae基因组序列作为测试对象,并与当前通用的重复体识别算法RECON以及新近的识别算法RepeatScout做了比较分析.结果表明RepeatSearcher使每一条重复体序列具有了精确的边界,而且相对其它算法在没有损失精度的情况下,缩短了算法的运行时间.

英文摘要:

Most existing methods of repeat identification either rely on annotated repeat databases or limit repeats to pairs of similar sequences that are maximal in length. And there is no an exact definition to correctly balances the importance of the length and the frequency. For these shortages, a fast method for repeats identification of repeat families via extension of consensus seed is proposed in this paper, which enables a rigorous definition of repeat boundaries and is based on the variant of BLAST algorithm. The known C.briggsae is used for testing the Repeat- Searcher. RepeatSearcher is compared with RECON, the most popular repeats identification algorithm, and the newly developed RepeatScout. The experimental results indicate that Repeat- Searcher has more accurate boundaries for each repeats, and the time of RepeatSearcher is reduced as compared with other methods with guaranteed accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433