位置:成果数据库 > 期刊 > 期刊详情页
在线挖掘数据流滑动窗口中最大频繁项集
  • ISSN号:1004-731X
  • 期刊名称:系统仿真学报
  • 时间:0
  • 页码:1134-1140
  • 语言:中文
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]国防科技大学机电工程与自动化学院,长沙410073, [2]国防科技大学计算机学院,长沙410073
  • 相关基金:国家自然科学基金资助项H(60573057,60704038)
  • 相关项目:基于多分辨率模型的复杂系统探索性仿真研究
中文摘要:

相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术—“子集等价剪枝技术”,有效缩小搜索空间的大小。基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+。FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集。仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax^*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快。

英文摘要:

For the number of maximal frequent itemsets (MFIs) is less than that of frequent itemsets, the efficiency of algorithm for mining MFIs is higher. A novel single-pass lexicographical-order FP-Tree based algorithm, FPMF1-DS was proposed. FPMFI-DS uses a kind of mixed item. ordering policy and imports a new pruning technique, subset equivalence pruning technique. These two techniques effectively decrease the size of searching space. Based on FPMFI-DS, another algorithm, FPMFI-DS+ was proposed, which'could mine MFls in sliding window over data streams in an online updating fashion. FPMFI-DS+ can maintain MFIs in current sliding window over data streams at any time. The experiments show that FPMFI-DS is comparable with multi-pass algorithm FPMax^* regarding with the efficiency, and has good scalability, and FPMFI-DS+ has high updating-miningspeed.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《系统仿真学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团公司
  • 主办单位:北京仿真中心 中国仿真学会
  • 主编:李伯虎
  • 地址:北京市海淀区永定路50号院
  • 邮编:100039
  • 邮箱:simu-xb@vip.sina.com
  • 电话:010-88527147
  • 国际标准刊号:ISSN:1004-731X
  • 国内统一刊号:ISSN:11-3092/V
  • 邮发代号:82-9
  • 获奖情况:
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:51729