位置:成果数据库 > 期刊 > 期刊详情页
基于滑动窗口的不确定性数据流频繁项集挖掘算法
  • ISSN号:1000-386X
  • 期刊名称:计算机应用与软件
  • 时间:2015.12.15
  • 页码:12-15
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]安徽大学计算机科学与技术学院,合肥230601
  • 相关基金:国家自然科学基金(No.61202227);安徽省自然科学基金(No.1408085MF122).
  • 相关项目:基于分形与数据流挖掘技术的动态数据挖掘方法及其应用研究
中文摘要:

对于大型数据,频繁项集挖掘显得庞大而冗余,挖掘最大频繁项集可以减少挖出的频繁项集的个数。可是对于不确定性数据流,传统判断项集是否频繁的方法已不能准确表达项集的频繁性,而且目前还没有在不确定数据流上挖掘最大频繁项集的相关研究。因此,针对上述不足,提出了一种基于衰减模型的不确定性数据流最大频繁项集挖掘算法TUFSMax。该算法采用标记树结点的方法,使得算法不需要超集检测就可挖掘出所有的最大频繁项集,节约了超集检测时间。实验证明了提出的算法在时间和空间上具有高效性。

英文摘要:

For large data bases, the number of frequent itemsets is huge and redundancy, and mining maximum frequentitemsets is more suitable because the scale of the output is much smaller. But traditional mining maximum frequent itemsetsalgorithm assumes the availability of precise data. Mining frequent itemsets from uncertain data streams is muchmore complicated than precise streams, and there is no research on mining maximum frequent itemsets over uncertaindata streams until now. Therefore, aiming at the shortcoming, the paper proposes a maximum frequent itemsets miningalgorithm TUFSMax. The algorithm adopts a decay window model to find frequent itemsets through calculating expectedsupports, and it uses a new method, called marking the tree nodes. By using the new method, algorithm TUFSMax canavoid super detection in the course of mining all of the maximum frequent itemsets, to save the detection time. Experimentalresults show that the proposed algorithm is efficient in time and space.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463