位置:成果数据库 > 期刊 > 期刊详情页
基于层次的最大频繁项集挖掘算法
  • ISSN号:1674-6236
  • 期刊名称:《电子设计工程》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华南理工大学,广东广州510006
  • 相关基金:中国民用航空总局联合资助项目(60776816)
中文摘要:

关联规则的研究是数据挖掘中的重要问题,如何高效地发现频繁项集是关联规则研究中的关键问题。根据数据库事务的统计性规律,在最大频繁项集发现算法Apriori及其变种算法的基础上,提出一种新的基于层次的最大频繁项集的发现算法。首先从整体上判断候选集的频繁性,然后在发现最大频繁项集的过程中,通过引入整体性策略、排序策略、最小策略有效地减少了候选集与数据库事务之间的比较次数。实验结果表明,采用该算法处理数据库事务数量大的最大频繁项集的发现任务.其效率相比Aoriori算法有显著的提高。

英文摘要:

The research on association rule is an important problem in data mining,how to efficiently discover frequent itemsets is a key problem in association rule research.According to the statistical nature of database transaction,and based on the maximum frequent itemsets discovery algorithm Apriori and its variants,this paper proposes a new algorithm for discovering maximum frequent itemsets that based on layer. Firstly,the algorithm judged the overall frequency of the candidate itemsets, and then through the introduction of the overall strategy,sequencing strategy,the minimum strategy,effectively reduced the comparison times between database transactions and candidates in the process of discovering maximum frequent itemsets. Experimental results show that:when finding maximum frequent itemsets,the efficiency of this algorithm is much better than Apriori in dealing with the task that with large number of database transaction.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电子设计工程》
  • 中国科技核心期刊
  • 主管单位:九三学社陕西省委员会
  • 主办单位:西安三才科技实业有限公司
  • 主编:严明
  • 地址:西安市高新区高新路25号瑞欣大厦10A室
  • 邮编:710082
  • 邮箱:editor@ieechina.com
  • 电话:029-84350396
  • 国际标准刊号:ISSN:1674-6236
  • 国内统一刊号:ISSN:61-1477/TN
  • 邮发代号:52-142
  • 获奖情况:
  • 中国学术期刊综合评价数据库来源期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:13470