位置:成果数据库 > 期刊 > 期刊详情页
面向高速数据流的偏倚抽样集合分类器
  • 期刊名称:北京邮电大学学报,2010,33(4): 44-48页
  • 时间:0
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工程大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:国家自然科学基金项目(60873037)
  • 相关项目:基于Mobile Agent 的分布式数据流挖掘技术研究
中文摘要:

针对高速数据流的流速超过集合分类器的处理能力,集合分类器无法训练全部最近到达的数据以更新分类器模型的问题,提出一种偏倚抽样集合分类器算法.通过偏差方差分解方法分析集合分类器的期望错误,利用计算待抽样数据的期望错误贡献度,实现数据的偏倚抽样,有效缩减了集合分类器的训练更新时间.与随机抽样集合分类器方法进行了比较.理论分析和实验结果表明,在抽样比例相同的条件下,该方法可以有效提高集合分类器的分类准确率.

英文摘要:

High speed data stream brings the phenomenon that the data rate is higher relative to the ensemble classifiers' computational power,so the ensemble classifiers can't train all data which reached recently to update themselves. An ensemble classifiers is proposed based on biased sample. Expectation error is analyzed through biased variance decomposition method,and the data is also biased sampled by computing all data's expectation error contribution degree which is waited for being sampled. This method can reduce time to train and update ensemble classifiers and will be contrasted with random sample ensemble classifiers. It indicates that this method has more prediction accuracy on condition the same proportion of sample.

同期刊论文项目
期刊论文 42 会议论文 8 获奖 2
同项目期刊论文