位置:成果数据库 > 期刊 > 期刊详情页
基于频繁模式树的约束最大频繁项目集挖掘算法研究
  • 期刊名称:应用科学学报, 2006, 24(1):64-69
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]东南大学计算机科学与工程系,江苏南京210096, [2]江苏大学计算机科学与通信工程学院,江苏镇江212013, [3]南京审计学院,江苏南京210029
  • 相关基金:国家自然科学基金(60572112);江苏大学科研基金(04KJD001)资助项目
  • 相关项目:基于数据挖掘的医学图像分类研究
中文摘要:

目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的。

英文摘要:

Most algorithms of frequent itemsets (or maximum frequent itemsets) do not consider any domain knowledge. As a result they generate many irrelevant patterns. Therefore, finding constrained maximum frequent itemsets is a key in important data mining application such as discovery of constrained association rules, constrained strong rules, etc. Little work has been done on this problem. This paper presents an effective algorithm for mining constrained maximum frequent itemsets and its update, update constrained maximum frequent itemsets algorithm, based on a novel frequent pattern tree (FP-tree) structure that is an extended prefix-tree structure for storing compressed and crucial information about frequent patterns. Experiments show that the algorithm is effective.

同期刊论文项目
期刊论文 53 会议论文 1 著作 1
同项目期刊论文