位置:成果数据库 > 期刊 > 期刊详情页
面向基因数据分类的核主成分分析旋转森林算法
  • ISSN号:1673-9418
  • 期刊名称:《计算机科学与探索》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]中国计量大学信息工程学院,杭州310018, [2]中国计量大学现代科技学院,杭州310018
  • 相关基金:The National Natural Science Foundation of China under Grant Nos. 61272315, 60905034 (国家自然科学基金); the Natural ScienceFoundation of Zhejiang Province under Grant No. Y1110342 (浙江省自然科学基金); the National Security Bureau Project underGrant No. zhejiang-00062014AQ (国家安全总局项目).
中文摘要:

旋转森林(rotation forest,RoF)是一种运用线性分析理论和决策树的集成分类算法,在分类器个数较少的情况下仍可以取得良好的结果,同时能保证集成分类的准确性。但对于部分基因数据集,存在线性不可分的情况,原始的算法分类效果不佳。提出了一种运用核主成分分析变换的旋转森林算法(rotation forest algorithm based on kernel principal component analysis,KPCA-RoF),选择高斯径向基核函数和主成分分析的方法对基因数据集进行非线性映射和差异性变化,着重于参数的选择问题,再利用决策树算法进行集成学习。实验证明,改进后的算法能很好地解决数据线性不可分的情形,同时也提高了基因数据集上的分类精度。

英文摘要:

Rotation forest(RoF)algorithm is an ensemble classification algorithm using linear analysis theory and decision trees.The rotation forest achieves higher classification accuracy and superior performance with less number of classifiers.However,the classification accuracy decreases for gene expression data with linearly inseparable cases.To address this issue,this paper proposes a rotation forest algorithm based on kernel principal component analysis(KPCA-RoF),chooses the Gaussian kernel function and principal component analysis to implement the nonlinear mapping and deal with differences in gene data.The proposed algorithm focuses on the optimization of parameters,and uses decision tree algorithm for ensemble learning.Experiments show that the new algorithm well addresses the linearly inseparabal issue and improves the classification accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机科学与探索》
  • 中国科技核心期刊
  • 主管单位:中国电子科技集团公司
  • 主办单位:华北计算技术研究所
  • 主编:李建中
  • 地址:北京市619信箱26分箱海淀区北四环中路211号
  • 邮编:100083
  • 邮箱:fcst@vip.163.com
  • 电话:010-51616056
  • 国际标准刊号:ISSN:1673-9418
  • 国内统一刊号:ISSN:11-5602/TP
  • 邮发代号:82-560
  • 获奖情况:
  • 工业和信息化部优秀科技期刊,中国计算机学会优秀会刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2014版)
  • 被引量:1928