位置:成果数据库 > 期刊 > 期刊详情页
带通配符的多序列模式挖掘
  • ISSN号:0469-5097
  • 期刊名称:《南京大学学报:自然科学版》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]合肥工业大学计算机与信息学院,合肥230009, [2]合肥师范学院计算机科学与技术系,合肥230601
  • 相关基金:国家“863”计划(2012AA011005); 国家自然科学基金(60975034); 安徽省自然科学基金(11040606M134)
中文摘要:

带有通配符的多序列模式挖掘在文本检索、网络安全、生物科学等领域中具有很重要的作用.通过挖掘多序列模式,能够透彻的了解序列之间的联系,在各个领域中具有重要的现实意义.在已有的工作中,随着多序列集长度的增大,挖掘的规模呈现指数级增长.研究这样一个问题:给定多条序列s1,…,sn,支持度阈值和间隔约束,从多序列中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一个有效的算法M-OneOffMine,模式在序列中的出现满足one-off条件.在生物DNA序列上的实验结果表明,M-OneOffMine算法比相关的序列模式挖掘算法具有更好的时间性能.

英文摘要:

Mining multi-sequential patterns with gap constraints is an important research task in many domains,such as text retrieval,network security,and biological science.In the previous work,with the length of the multi-sequence increasing,the mining scale presents exponential increasing,and those algorithms merely mined patterns with the limited length.Given the sequences s1,…,sn,a certain threshold,and gap constraints,we aim to discover frequent patterns whose supports in multiple sequence are no less than the given threshold value.There are flexible wildcards in pattern P,and the number of the wildcards between any two successive elements of P fulfills the user-specified gap constraints.In this paper,we design an efficient mining algorithm,named M-OneOffMine that satisfies the one-off condition under which each character in the given sequence can be used at most once in all occurrences of a pattern.The experiments on DNA sequences show that M-OneOffMine has better time performances than the related algorithms.The time and space complexities of M-OneOffMine are respectively O(kmnlw)and O(k(l+n)),where m is the number of frequent patterns,k is the number of element sequences,n is the length of the pattern,l is the length of the multiple sequence,and w is the flexibility of the gap constraint.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《南京大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国教育部
  • 主办单位:南京大学
  • 主编:龚昌德
  • 地址:南京汉口路22号南京大学(自然科学版)编辑部
  • 邮编:210093
  • 邮箱:xbnse@netra.nju.edu.cn
  • 电话:025-83592704
  • 国际标准刊号:ISSN:0469-5097
  • 国内统一刊号:ISSN:32-1169/N
  • 邮发代号:28-25
  • 获奖情况:
  • 中国自然科学核心期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9316