位置:成果数据库 > 期刊 > 期刊详情页
基于FP-Tree的快速选择性集成算法
  • ISSN号:1000-9825
  • 期刊名称:软件学报
  • 时间:0
  • 页码:709-721
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]国防科学技术大学计算机学院,湖南长沙410073
  • 相关基金:国家自然科学基金(60773017 60905032)
  • 相关项目:网络攻击行为的高效在线机器学习技术研究
中文摘要:

选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree(frequent pattern tree)的快速选择性集成算法:CPM-EP(coverage based pattern mining for ensemble pruning).该算法将基分类器对校验样本集的分类结果组织成一个事务数据库,从而使选择性集成问题可转化为对事务数据集的处理问题.针对所有可能的集成分类器大小,CPM-EP算法首先得到一个精简的事务数据库,并创建一棵FP-Tree树保存其内容;然后,基于该FP-Tree获得相应大小的集成分类器.在获得的所有集成分类器中,对校验样本集预测精度最高的集成分类器即为算法的输出.实验结果表明,CPM-EP算法以很低的计算开销获得优越的泛化能力,其分类器选择时间约为GASEN的1/19以及Forward-Selection的1/8,其泛化能力显著优于参与比较的其他方法,而且产生的集成分类器具有较少的基分类器.

英文摘要:

By selecting parts of base classifiers to combine,ensemble pruning aims to achieve a better generalization and have less prediction time than the ensemble of all base classifiers.While,most of the ensemble pruning algorithms in literature consume much time for classifiers selection.This paper presents a fast ensemble pruning approach: CPM-EP(coverage based pattern mining for ensemble pruning).The algorithm converts an ensemble pruning task into a transaction database process,where the prediction results of all base classifiers for the validation set are organized as a transaction database.For each possible size k,CPM-EP obtains a refined transaction database and builds a FP-Tree to compact it.Next,CPM-EP selects an ensemble of size k.Among the obtained ensembles of all different sizes,the one with the best predictive accuracy for the validation set is output.Experimental results show that CPM-EP reduces computational overhead considerably.The selection time of CPM-EP is about 1/19 that of GASEN and 1/8 that of Forward Selection.Additionally,this approach achieves the best generalization,and the size of the pruned result is small.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《软件学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院软件研究所 中国计算机学会
  • 主编:赵琛
  • 地址:北京8718信箱中国科学院软件研究所
  • 邮编:100190
  • 邮箱:jos@iscas.ac.cn
  • 电话:010-62562563
  • 国际标准刊号:ISSN:1000-9825
  • 国内统一刊号:ISSN:11-2560/TP
  • 邮发代号:82-367
  • 获奖情况:
  • 2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:54609