位置:成果数据库 > 期刊 > 期刊详情页
基于等价类划分的并行频繁闭项集挖掘算法
  • ISSN号:1003-0972
  • 期刊名称:《信阳师范学院学报:自然科学版》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]周口师范学院网络工程学院,河南周口466001, [2]中国科学院自动化研究所,北京100190
  • 相关基金:国家自然科学基金项目(61103143); 河南省高等学校重点科研项目(15A520116,16A520105); 河南省科技攻关项目(162102210396,152102210367)
中文摘要:

针对海量数据的关联规则挖掘问题,提出了一种有效的基于等价类划分的并行频繁闭项集挖掘算法.该算法在MapReduce框架下,通过等价类的产生与划分、数据集的分配、异步频繁闭项集挖掘和汇总等步骤,不但较好地解决了多节点间的负载均衡问题,而且易于获得可靠的频繁闭项集.实验表明,该算法能有效克服传统算法挖掘效率低、冗余规则较多的缺点,整体上具有较高的性能.

英文摘要:

For the problems of association rules mining of massive database,an effective parallel approach for the closed frequent itemsets mining based on the division of equivalence classes was presented. Under the framework of MapReduce,the proposed approach performs through three steps: 1) the division of equivalence class,2) the allocation of data set,and 3) the asynchronous mining and aggregation of frequent closed itemsets. Such a strategy can significantly solve the load balancing problem of multiple nodes and obtain the reliable frequent closed itemsets. Experimental results showed that the approach can effectively overcome the drawbacks of traditional approaches such as low efficiency of mining,more redundant rules and so on,and gain higher performance.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《信阳师范学院学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:信阳师范学院
  • 主办单位:信阳师范学院
  • 主编:刘彦明
  • 地址:河南省信阳市南湖路
  • 邮编:464000
  • 邮箱:xblk@xynu.edu.cn
  • 电话:0376-6393516
  • 国际标准刊号:ISSN:1003-0972
  • 国内统一刊号:ISSN:41-1107/N
  • 邮发代号:36-122
  • 获奖情况:
  • 河南省优秀科技期刊,河南省优秀学报
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),英国农业与生物科学研究中心文摘,波兰哥白尼索引,德国数学文摘,美国剑桥科学文摘,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:5214