位置:成果数据库 > 期刊 > 期刊详情页
针对短测序片段的基因序列拼接算法
  • ISSN号:1000-7024
  • 期刊名称:计算机工程与设计
  • 时间:0
  • 页码:1832-1836
  • 分类:TP274[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]四川大学计算机学院,四川成都610065
  • 相关基金:国家自然科学基金项目(60903318、60832011);国家自然科学基金重点项目(60736046); 国家973重点基础研究发展计划基金项目(2009CB320803)
  • 相关项目:先进塔台视景模拟系统基础理论与关键技术
中文摘要:

为了获得高效的拼接结果,针对新测序技术产生的较短测序片段,提出了通过对测序片段编码,将其映射到能够快速查找的自定义表中,结合高效位并行字符串模糊匹配算法———BPM,从自定义表中寻找较长连通路径的方法,实现了对短测序片段的快速拼接。实验结果表明,该算法针对500M的高质量源数据,在耗时136s的情况下,准确度可达79%,覆盖度可达82%;针对错误率为0.1%的500M源数据,在耗时150s的情况下,准确度可达72%,覆盖度可达73%。在短时间内较好的完成了拼接任务。

英文摘要:

The sequences(also called read) generated by new technologies are very short.For these short reads,in order to get the high effective sequencing results,after be encoded,they are mapped into a customized table,then an effective bit parallel fuzzy string match algorithm is employed,that is,BPM.Finally a long connected path in the customized table is found to achieve the rapid genomic sequence assembly.The experimental results show that,under the condition of running the algorithm on the 500M high quality source data,the time consumes 136s,the accuracy rate achieves 79%,and the coverage rate achieves 82%.For 500M source data contains 0.1% error rate,the time consumes 150s,the accuracy rate achieves 72%,and the coverage rate achieves 73%.The task is well done in a short time.

同期刊论文项目
期刊论文 101 会议论文 21 专利 5
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616