位置:成果数据库 > 期刊 > 期刊详情页
基于概率分布估计的混合采样算法
  • ISSN号:1001-0920
  • 期刊名称:控制与决策
  • 时间:2014
  • 页码:815-820
  • 分类:TP273[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]东北大学信息科学与工程学院,沈阳 110004, [2]东北大学医学影像计算教育部重点实验室,沈阳 110004
  • 相关基金:国家自然科学基金项目(61001047);中央高校基本科研业务费专项资金项目(N110618001).
  • 相关项目:基于MSCT体数据的慢性阻塞性肺疾病定量评估关键算法研究
中文摘要:

在类别不均衡的数据中,类间和类内不均衡性问题都是导致分类性能下降的重要因素。为了提高不均衡数据集下分类算法的性能,提出一种基于概率分布估计的混合采样算法。该算法依据数据概率分别对每个子类进行采样以保证类内的均衡性;并扩大少数类的潜在决策域和减少多数类的冗余信息,从而同时从全局和局部两个角度改善数据的平衡性。实验结果表明,该算法提高了传统分类算法在不均衡数据下的分类性能。

英文摘要:

In the class imbalanced data distribution, both the between-class and within-class imbalance issues are critical factors to decrease the performance. To improve the performance of classifier algorithm on the imbalanced data, a hybrid sampling algorithm based on probability distribution estimation is proposed. The approach re-samples the data of subclass to balance the distribution in each class based on probability distribution estimation. Moreover, it expands the decision region of minority class and removes the redundant information of majority class, so as to solve the imbalance issues from both global and local perspectives simultaneously. Experimental results show that the proposed method improves the classification performance for imbalanced data.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《控制与决策》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国教育部
  • 主办单位:东北大学
  • 主编:张嗣瀛 王福利
  • 地址:沈阳市东北大学125信箱
  • 邮编:110004
  • 邮箱:kzyjc@mail.neu.edu.cn
  • 电话:024-83687766
  • 国际标准刊号:ISSN:1001-0920
  • 国内统一刊号:ISSN:21-1124/TP
  • 邮发代号:8-51
  • 获奖情况:
  • 1997年被评为辽宁省优秀编辑部,1999年期刊影响因子在信息与系统类期刊中排名第二位
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:32961