位置:成果数据库 > 期刊 > 期刊详情页
不平衡数据的集成分类算法综述
  • ISSN号:1001-3695
  • 期刊名称:计算机应用研究
  • 时间:2014
  • 页码:1287-1291
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]新疆师范大学网络信息安全与舆情分析重点实验室,乌鲁木齐830054, [2]南京航空航天大学计算机科学与技术学院,南京210016
  • 相关基金:新疆自治区高校科研计划资助项目(XJEDU2012S28);国家教育部人文社会科学研究青年基金资助项目(11YJC870014);新疆师范大学重点实验室基金资助项目(WLYQ2012108);国家自然科学基金资助项目(61163045)
  • 相关项目:面向农业领域的维汉双语术语抽取的关键技术研究
中文摘要:

集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。

英文摘要:

Ensemble learning by integrating multiple base classifiers that trained different set can effectively improve the clas- sification accuracy. In the base classifier training process,imbalanced data set can be processed by either cost-sensitive or data sampling technology. Due to the advantages of ensemble learning in imbalanced data classification, ensemble algorithms for ira- balanced data classification have been widely research. This paper surveyed the state of the art of imbalanced data ensemble classification algorithms, including the mechanisms and features of major existing learning algorithms, their advantages and dis- advantages, highlighted the open research issues and future research directions.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049