位置:成果数据库 > 期刊 > 期刊详情页
基于多层挖掘策略的特征选择及在科技文献分类中的应用
  • ISSN号:1673-5196
  • 期刊名称:《兰州理工大学学报》
  • 时间:0
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:郑州轻工业学院计算机与通信工程学院,河南郑州450002
  • 相关基金:国家自然科学基金(61201447); 河南省科技攻关项目(122102210024,122300410287); 河南省高等学校青年骨干教师资助计划项目(2014GGJS-084); 河南省教育厅科学技术研究重点项目(13A520367)
中文摘要:

提出一种应用于科技文献分类的文本特征选择方法.该方法运用了聚类与关联规则的思想,对文本特征进行逐层选择.同时为提高K-means算法的聚类性能,对K-means算法做了相应的改进,通过为算法的终止条件设定标准值来减少算法迭代次数,减少学习时间;通过删除由信息动态变化而产生的冗余信息,来减少动态聚类过程中的干扰.采用KNN分类器进行对比实验,实验结果表明,该特征选择方法在科技文献分类方面有较高的准确率.

英文摘要:

A text feature selection method was proposed for classification of scientific and technological literatures.In this method,the idea of clustering and association rules was used to select the text feature layer by layer.Meantime,the K-means algorithm was modefied to improve its clustering performance,the amount of iteration and the time of self-learning in this algorithm was reduced by means of setting a standard allowance to terminate the tedious iterative computation,and the interference in the process of dynamic clustering was reduced by eliminating the redundant information induced by dynamic change of the information.It was shown by the test for comparison with KNN classifier that the feature selection method presented in this article has a higher accuracy for classification of scientific and technological literature.

同期刊论文项目
期刊论文 44 会议论文 6 获奖 8
同项目期刊论文
期刊信息
  • 《兰州理工大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:甘肃省教委
  • 主办单位:兰州理工大学
  • 主编:李有堂
  • 地址:甘肃省兰州市兰工坪路287号
  • 邮编:730050
  • 邮箱:journal@lut.cn
  • 电话:0931-2756301
  • 国际标准刊号:ISSN:1673-5196
  • 国内统一刊号:ISSN:62-1081/T
  • 邮发代号:54-72
  • 获奖情况:
  • 甘肃高等校优秀学术期刊,全国优秀高校自然科学学报及教育部优秀科技期刊评...,第二届国家期刊奖百种重点期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:6651