位置:成果数据库 > 期刊 > 期刊详情页
基于蚁群算法的文本分类和聚类
  • ISSN号:1009-8054
  • 期刊名称:信息安全与通信保密
  • 时间:0
  • 页码:57-59
  • 语言:中文
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海交通大学信息安全工程学院,上海200240, [2]上海交通大学电子工程系,上海200240
  • 相关基金:国家自然科学基金资助项目(60772098);上海市曙光计划项目;863计划项目(2007AA012455);教育部新世纪优秀人才支持计划项目(NCET-06-0393).
  • 相关项目:基于特征概念网的网上离散文本信息舆情分析研究
中文摘要:

为了研究并提高文本的分类和聚类算法的性能,笔者根据蚁群算法在TSP问题中的应用方法,将其改进引用到文本的分聚类中。在文本聚类中,改变蚂蚁的信息素释放机制,道路节点的聚合方式,最终将相似文本进行聚合。在文本的分类中,将所需要的分类信息装入蚂蚁,蚂蚁根据系统外部所希望的方式将文本分类。实验结果证明,这种新的算法可以使文本分类和聚类的准确度提高,蚁群算法在文本分类聚类中的应用是可行的。

英文摘要:

In order to study and improve performance of text classification and clustering, the authors, based on the usage of ant colony algorithm in solving the TSP(travelling salesman problem), modify and use this algorithm in the text classification and clustering. When this algorithm is used to cluster texts, the way for releasing ants' pheromone, and the mode for clustering path-nodes as well should be changed, and finally the similar texts are placed together. In text classification, the information must be told to the ants, which indicates the final categories and is wanted before the process. The experiment indicates the facts that this new method could increase the rate of accuracy, and that the ant colony algorithm could be used in text classification and clustering.

同期刊论文项目
期刊论文 49 会议论文 5 获奖 1 专利 6 著作 1
同项目期刊论文
期刊信息
  • 《信息安全与通信保密》
  • 主管单位:中国电子科技集团公司
  • 主办单位:中国电子第三十研究所
  • 主编:惠志斌 鲁传颖
  • 地址:四川成都市高新区创业路8号
  • 邮编:610041
  • 邮箱:
  • 电话:028-88203306 85169935
  • 国际标准刊号:ISSN:1009-8054
  • 国内统一刊号:ISSN:51-1608/TN
  • 邮发代号:62-208
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:7388