位置:成果数据库 > 期刊 > 期刊详情页
改进的多类不平衡数据关联分类算法
  • ISSN号:1003-6059
  • 期刊名称:模式识别与人工智能
  • 时间:2015.10
  • 页码:922-929
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]闽南师范大学计算机学院,漳州363000
  • 相关基金:国家自然科学基金项目(No.61170129)、福建省自然科学基金项目(No.2013J01259)、福建省中青年教师教育科研项目(No.JA15303)资助
  • 相关项目:方剂药物组配规律的有向图挖掘技术研究
中文摘要:

由于多类不平衡数据中某些类别的样例数特别少,使得基于支持度一置信度的关联分类方法在这些类上产生的规则较少,甚至没有,从而导致这些类别的样例很难准确分类.针对此问题,文中提出改进的多类不平衡数据关联分类算法.为了提取更多小类的规则,根据项集与类别的正相关度提取规则.为了提高小类规则的优先级,提出利用项集类分布规则强度排序规则.此外,为解决规则冲突或无规则匹配问题,结合KNN分类新样例.实验表明,与基于支持度一置信度的关联分类方法相比,文中算法能提取更多的小类规则,且提高小类规则的优先级,在多类不平衡数据上取得较高的G—mean值和F-score值.

英文摘要:

Instances in some classes are rare in muhiclass imbalanced datasets and therefore few rules for these classes are generated by support-confidence based associative classification algorithms. Consequently, instances in these minority classes are difficult to be correctly classified. Aiming at this problem, an improved associative classification algorithm for multiclass imbalanced datasets is proposed. To extract more rules for minority classes, rules are extracted according to positive correlation between itemsets and classes. Then, to improve the priority of minority classes rules, the rule strength based on itemsets class distribution is designed to rank rules. Finally, to address problems of no matched rules or matched rules in conflict, a k nearest neighbor algorithm is incorporated into the improved associative classification to classify new instances. Experimental results show that the proposed algorithm extracts more minority classes rules and promotes the priority of the minority classes rules compared with support-confidence based associative classification, and thus G-mean and F-score value for muhiclass imbalance datasets are improved.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169