位置:成果数据库 > 期刊 > 期刊详情页
一种基于新的特征选择的海量网络文本挖掘算法研究
  • ISSN号:1001-3695
  • 期刊名称:《计算机应用研究》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程] TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西财经大学信息管理学院,太原030006, [2]山西大学计算机与信息技术学院,太原030006
  • 相关基金:国家自然科学基金资助项目(61070100);山西省自然科学基金资助项目(20120005;山西省教育厅基金资助项目(20110427)
中文摘要:

为了提高文本自动分类准确率,提出一种改进的蜂群优化神经网络的选择特征的文本数据挖掘算法。该算法将文本特征选择转换成一个多目标优化问题,以特征维数最少、分类正确率最高为选择标准,采用蚁群算法找到最优特征子集,最后神经网络建立文本自动分类器,进行仿真实验测试算法性能。仿真实验结果表明,提出的方法从高维文本最优文本特征,提高了文本自动分类的正确率和识别效率,-是一种有效的网络文本挖掘算法。

英文摘要:

In order to improve text classification accuracy, this paper proposed a text automatic categorization method based on ant colony algorithm and neural network. Firstly, it transformed the text feature selection into a multi-objective optimization problem, and took the feature dimension and the correct rate as a feature selection evaluation criteria, and used ant colony al- gorithm to solve the multi objective optimization problems to find the optimal feature subset, and then optimized the parameters of neural network by ant colony algorithm to establish the optimal text categorizer. The results show that the simulation experi- ment arry out on the text data, this proposed method not only can quickly find the optimal feature subset of text, but also im- proves the classification accuracy and efficiency.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049