位置:成果数据库 > 期刊 > 期刊详情页
DNA序列中基于后继数组索引的LPR查找算法
  • 期刊名称:王镝 王国仁 吴青泉 陈白尘 赵毅 毛克明. DNA序列中基于后继数组索引的LPR查找算法. 计算机
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:东北大学信息科学与工程学院,沈阳,110004 东北大学信息科学与工程学院,沈阳,110004 东北大学信息科学与工程学院,沈阳,110004, 上海宝信软件股份有限公司,上海,201203 东北大学信息科学与工程学院,沈阳,110004 东北大学信息科学与工程学院,沈阳,110004 东北大学信息科学与工程学院,沈阳,110004
  • 相关基金:国家自然科学基金项目(60273079,60573089)
  • 相关项目:基于后继数组的生物序列模式发现技术研究
中文摘要:

DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引--后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n).

同期刊论文项目
期刊论文 68 会议论文 26 著作 1
同项目期刊论文