位置:成果数据库 > 期刊 > 期刊详情页
三种分类算法偏差-方差结构的比较:MCLP,LDA和C5.0
  • ISSN号:2095-6134
  • 期刊名称:《中国科学院大学学报》
  • 时间:0
  • 分类:O29[理学—应用数学;理学—数学] N945[自然科学总论—系统科学]
  • 作者机构:[1]中国科学院研究生院,北京100080, [2]中国科学院虚拟经济与数据科学研究中心,北京100080, [3]首都经济贸易大学统计学院,北京100070, [4]中央财经大学管理科学与工程学院,北京100081
  • 相关基金:国家自然科学基金(70621001,70531040,70501030,10601064,70472074,90718042)、北京市自然科学基金(9073020)和973项目(2004CB720103)资助
中文摘要:

基于Domingos的期望预测误差分解框架,在3个数据集上,对MCLP、LDA和C5.0这3种算法的偏差-方差结构特点进行了比较分析.实验结果表明,一般来说,C5.0呈现低偏差-高方差的特点,LDA与之相反,而MCLP则介于两者之间,比较接近LDA.当训练集样本量较小时,MCLP的偏差和方差都相对较高,而随着训练集的增大,MCLP的偏差和方差明显减小,甚至低于其他两者.

英文摘要:

Based on Domingos' bias-variance decomposition framework, on three different data sets, we compared the bias-variance structure of the three classification methods: MCLP, LDA and C5.0. The experimental results showed that, generally speaking, C5.0 has low bias and high variance, LDA has high bias and low variance, and MCLP is in between them but near LDA. When the training set is small, bias and variance of MCLP is comparatively high. However, with the increasing of training set, bias and variance of MCLP obviously decrease and even are lower than those of C5.0 and LDA. This study established the basis for constructing the ensemble suited to MCLP.

同期刊论文项目
期刊论文 30 会议论文 22 著作 3
期刊论文 70 会议论文 74 著作 4
期刊论文 36 会议论文 25 著作 2
期刊论文 16 会议论文 24 著作 1
期刊论文 62 会议论文 79 著作 3
同项目期刊论文
期刊信息
  • 《中国科学院大学学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院大学
  • 主编:石耀霖
  • 地址:北京玉泉路19号(甲)
  • 邮编:100049
  • 邮箱:journal@gucas.ac.cn
  • 电话:010-88256013
  • 国际标准刊号:ISSN:2095-6134
  • 国内统一刊号:ISSN:10-1131/N
  • 邮发代号:82-583
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:416