位置:成果数据库 > 期刊 > 期刊详情页
文本分类中基于核的非线性判别
  • ISSN号:0255-8297
  • 期刊名称:《应用科学学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]解放军理工大学理学院,江苏南京210007, [2]徐州工程学院,江苏徐州221116
  • 相关基金:国家自然科学基金资助项目(No.70571087)
中文摘要:

针对文本分类问题中的特征降维问题,改进最大散度差鉴别准则,引入核变换作为前处理,使最大散度差鉴别准则可适用于更广泛的文本分类情形.提出一种基于核的非线性鉴别方法用于文本特征抽取.借助于核变换解决了散度差准则在用于文本分类时线性可分性较差的问题.在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩.文本分类试验结果表明,这种非线性方法与无核的最大散度差方法相比,F1值提高了4.7%,具有明显的效率上的优势.

英文摘要:

To achieve feature reduction in text categorization, the scatter difference criterion is improved to satisfy a broad range of text categorization problems using kernel commutation in the pre-treatment. A kernel-based nonlinear method is proposed to extract features. By kernel commutation, the stylebook categorization problem is solved with less linear separability. Dimension of the feature space is significantly reduced without incurring excessive information loss. Experiments show that performance of the proposed method is better than maximal scatter difference with an efficiency improvement of 4.7 % for the value of F1.

同期刊论文项目
期刊论文 77 会议论文 10 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《应用科学学报》
  • 中国科技核心期刊
  • 主管单位:上海市教育委员会
  • 主办单位:上海大学 中国科学院上海技术物理研究所
  • 主编:王延云
  • 地址:上海市上大路99号123信箱
  • 邮编:200444
  • 邮箱:yykxxb@departmenl.shu.edu.cn
  • 电话:021-66131736
  • 国际标准刊号:ISSN:0255-8297
  • 国内统一刊号:ISSN:31-1404/N
  • 邮发代号:4-821
  • 获奖情况:
  • 首届中国高校优秀科技期刊,第2届中国高校优秀科技期刊奖,全国高校优秀科技期刊,中国科技期刊方阵双效期刊,上海市优秀科技期刊,首届《CAJ-CD》执行优秀期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),荷兰文摘与引文数据库,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:4747