位置:成果数据库 > 期刊 > 期刊详情页
一种基于关键字树的DNA数据库搜索算法
  • ISSN号:1000-1220
  • 期刊名称:小型微型计算机系统
  • 时间:0
  • 页码:1944-1947
  • 语言:中文
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
  • 相关基金:国家自然科学基金项目(60741001;60871092;60671011)资助;黑龙江省杰出青年科学基金项目(JC200611)资助;黑龙江省自然科学重点项目(ZJG0705)资助.
  • 相关项目:类别驱动的RNA二级结构预测方法研究
作者: 邹权|
中文摘要:

针对BLAST等软件在生物数据库中搜索DNA分子序列时,不能兼顾时间开销和搜索敏感性的问题,提出一种基于关键字树的多种子搜索算法。首先将查询序列分割成多个种子并将它们构建成一棵关键字树;然后利用Aho—Corasick算法在数据库中搜索,找到每个种子的所有完全匹配;最后检查种子匹配密度大的区域,确定其是否是查询序列的近似出现。实验表明算法兼顾了时间开销和搜索的敏感性,而且能发现基因序列中的移位现象.

英文摘要:

Time consuming and sensitivity is incompatible when searching DNA database with BLAST. We propose a new searching algorithm based on keywords tree and multiple seeds. Firstly, query sequence is divided into a number of seeds, which are built into a keywords tree. Then all the seeds are sought in database by Aho-Corasick algorithm. At last it will be checked in the regions where seeds are found frequently. The novel algorithm improves both the time cost and the sensitivity. Furthermore, it can deal with the transform in the genome sequences. Experiments have proved our description.

同期刊论文项目
期刊论文 22 会议论文 7 获奖 1
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212