位置:成果数据库 > 期刊 > 期刊详情页
基于划分和压缩数据库的改进Apriori算法
  • ISSN号:1671-9727
  • 期刊名称:《成都理工大学学报:自然科学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]成都中医药大学医学信息工程学院,成都610075
  • 相关基金:国家自然科学基金资助项目(81102742); 四川省教育厅项目(12SB025); 成都中医药大学科技发展基金项目(ZRYB201147)
中文摘要:

针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。

英文摘要:

When the Apriori algorithm faces massive data,its rate is low.To counter the above problem,this paper puts forward an improved method based on the classification and database compression.Firstly,according to the appearing frequency of characteristic data,this method stores the data in a temporary array in ascending order.Then the original transaction database is divided into several disjoint transaction database in order to accommodate the daughter database in the memory.At last,the entire database frequent itemsets are calculated by the frequent itemsets calculated according to each daughter database,thereby eliminating the unnecessary redundant data.Through the improvement,the large data sets can be effectively divided and compressed,and the association rules can be tapped on the daughter database.The experimental results show that the improved Apriori algorithm has improved a lot in the speed and efficiency of mining the massive data.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《成都理工大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:四川省教育厅
  • 主办单位:成都理工大学
  • 主编:倪师军
  • 地址:成都市成华区二仙桥东三路1号
  • 邮编:610059
  • 邮箱:xuebaoz@cdut.edu.cn
  • 电话:028-84078973
  • 国际标准刊号:ISSN:1671-9727
  • 国内统一刊号:ISSN:51-1634/N
  • 邮发代号:62-24
  • 获奖情况:
  • 2010年10月获得"第三届中国高校精品科技期刊奖",2010年11月获得"百种中国杰出学术期刊"称号,2010年12月获得"首届四川省高校精品科技期刊奖",2011年12月获得"百种中国杰出学术期刊"称号,2011年12月获得"中国精品科技期刊"称号
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),荷兰地学数据库,荷兰文摘与引文数据库,美国地质文献预评数据库,英国动物学记录,美国石油文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:9176