位置:成果数据库 > 期刊 > 期刊详情页
关联规则挖掘的一种多剪枝概念格方法
  • ISSN号:1000-582X
  • 期刊名称:《重庆大学学报:自然科学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]安徽财经大学信息工程学院,安徽蚌埠233041, [2]南京航空航天大信息科学与技术学院,江苏南京230009
  • 相关基金:国家自然科学基金资助项目(60673127);安徽省高校自然科学研究资助项目(KJ20088089)
中文摘要:

多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned concept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiple pruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。

英文摘要:

Common mining methods of association rules from multiple data sources are inefficient due to many candidate itemsets for communication overhead or too many database scans. Based on the relationship between the pruned concept lattice (PCL) and the representation of frequent itemsets, the derived frequent itemsets of PCL was defined. A union algorithm of multiple pruned concpt (UMPCL), an approximate mining method of association rules in horizontally partitioned databases based on multiple PCLs was proposed. This method employed a frequency concept to represent some similar itemsets to redace the number of frequent itemsets. The same support threshold for pruning sub-concept lattices was amalgamated. Moreover, the pruning lattice was amalgamated from sub-concept lattices. These diminished the size of exchanged messages. Both theoretical analysis and experimention demonstrate that this approach is efficient.

同期刊论文项目
期刊论文 47 会议论文 6 专利 3
同项目期刊论文
期刊信息
  • 《重庆大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:国家教育部
  • 主办单位:重庆大学
  • 主编:王时龙
  • 地址:重庆市沙坪坝正街174号
  • 邮编:400044
  • 邮箱:cdxhz@equ.edu.cn
  • 电话:023-65102302
  • 国际标准刊号:ISSN:1000-582X
  • 国内统一刊号:ISSN:50-1044/N
  • 邮发代号:78-16
  • 获奖情况:
  • 中国高校精品科技期刊,重庆市一级期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:26478