东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于FP-Tree的快速选择性集成算法

ISSN号：1000-9825
期刊名称：软件学报
时间：0
页码：709-721
分类：TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]国防科学技术大学计算机学院,湖南长沙410073
相关基金：国家自然科学基金（60773017 60905032）
相关项目：网络攻击行为的高效在线机器学习技术研究

关键词：集成学习, 选择性集成, 频繁模式树, BAGGING, 误差反向传播神经网络, ensemble learning, ensemble pruning, frequent pattern tree（FP-tree）, bootstrap aggregation（Bagging）, back-propagation neural network（BPNN）

中文摘要：

选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree（frequent pattern tree）的快速选择性集成算法：CPM-EP（coverage based pattern mining for ensemble pruning）.该算法将基分类器对校验样本集的分类结果组织成一个事务数据库,从而使选择性集成问题可转化为对事务数据集的处理问题.针对所有可能的集成分类器大小,CPM-EP算法首先得到一个精简的事务数据库,并创建一棵FP-Tree树保存其内容;然后,基于该FP-Tree获得相应大小的集成分类器.在获得的所有集成分类器中,对校验样本集预测精度最高的集成分类器即为算法的输出.实验结果表明,CPM-EP算法以很低的计算开销获得优越的泛化能力,其分类器选择时间约为GASEN的1/19以及Forward-Selection的1/8,其泛化能力显著优于参与比较的其他方法,而且产生的集成分类器具有较少的基分类器.

英文摘要：

By selecting parts of base classifiers to combine,ensemble pruning aims to achieve a better generalization and have less prediction time than the ensemble of all base classifiers.While,most of the ensemble pruning algorithms in literature consume much time for classifiers selection.This paper presents a fast ensemble pruning approach： CPM-EP（coverage based pattern mining for ensemble pruning）.The algorithm converts an ensemble pruning task into a transaction database process,where the prediction results of all base classifiers for the validation set are organized as a transaction database.For each possible size k,CPM-EP obtains a refined transaction database and builds a FP-Tree to compact it.Next,CPM-EP selects an ensemble of size k.Among the obtained ensembles of all different sizes,the one with the best predictive accuracy for the validation set is output.Experimental results show that CPM-EP reduces computational overhead considerably.The selection time of CPM-EP is about 1/19 that of GASEN and 1/8 that of Forward Selection.Additionally,this approach achieves the best generalization,and the size of the pruned result is small.

同期刊论文项目

可生存的车载网络环境中数据可用性关键技术研究

期刊论文 14 会议论文 5 著作 1

网络攻击行为的高效在线机器学习技术研究

期刊论文 5 会议论文 4

同项目期刊论文

无线认知网络中一种团划分的频谱感知算法

一种城市车辆网络中的数据缓存算法

无线传感器网络被动红外目标跟踪技术研究

一种基于马尔可夫链的车辆自组网可生存模型

无线公车网络切换策略研究

基于速度向量的VANET位置预测路由协议

一种无线公交车载网络MAC协议的设计及性能分析

无线Mesh网络路由协议的研究进展

具有能量效率的容错多事件簇

无线传感器网络分布式连通算法

无线传感器网络环境感知的节点定位方法

无线Mesh网络的路径容量分析模型及算法

选择性集成算法分类与比较

A fast ensemble pruning algorithm based on pattern mining process

选择性集成开发平台的设计与实现

具有回忆和遗忘机制的数据流挖掘模型与算法

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609