位置:成果数据库 > 期刊 > 期刊详情页
一种基于核SMOTE的非平衡数据集分类方法
  • 期刊名称:电子学报
  • 时间:0
  • 页码:2489-2495
  • 语言:中文
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]厦门理工学院计算机科学与技术系,福建厦门361024, [2]浙江大学计算机科学与技术学院,浙江杭州310027
  • 相关基金:国家自然科学基金项目(No.60773177);福建省青年人才项目(No.2008F3108)
  • 相关项目:基于可废止逻辑的柔性Agent理论、算法与实现研究
中文摘要:

本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果.

英文摘要:

An approach based on kernel SMOTE (Synthetic Minority Over-sampling Technique) to solve classification on imbalance data set by Support Vector Machine (SVM) is presented. The method first oversamples the minority class in feature space by kernel SMOTE algorithm, then the pre-images of the synthetic instances are found based on a distance relation between feature space and input space.Finally,these pre-images are appended to the original data set to train a SVM.Experirnents on real data sets indicate that compared with SMOTE approach, the samples constructed by the kernel SMOTE algorithm have the higher quality. As a result, the effectiveness of classification by SVM on imbalance data set is improved.

同期刊论文项目
同项目期刊论文