位置:成果数据库 > 期刊 > 期刊详情页
面向离散文本舆情分析的分聚类方案
  • ISSN号:1009-8054
  • 期刊名称:信息安全与通信保密
  • 时间:0
  • 页码:65-67
  • 语言:中文
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海交通大学电子工程系信息安全学院,上海200240, [2]上海交通大学信息安全学院,上海200240
  • 相关基金:国家自然科学基金资助项目(批准号:60772098);国家重大基础研究973计划项目(编号:2010CB731400):教育部新世纪优秀人才支持计划项目(编号:NCET-06-0393);上海市曙光学者基金资助项目.
  • 相关项目:基于特征概念网的网上离散文本信息舆情分析研究
中文摘要:

离散文本已经成为一种占据重要地位的舆情信息表现形式,根据离散文本的特点,提出基于特征概念网的离散文本舆情信息的分聚类框架,在此基础上给出分聚类方案。在聚类算法中,运用了遗传算法的全局并行搜索能力、k—means的高效局部聚类能力和小生境的保持种群多样性抑制漂移能力;在分类算法中,先将训练文本库进行类内聚类成子类,对子类构建特征概念网以生成替代该子类的文本,再用KNN算法进行分类。最后结合舆情分析进一步提出了可用的改进方案。

英文摘要:

Discrete text has occupied an important position in public-opinion information. In order to analyze public opinion efficiently, this paper proposes a kind of high-performance classification and clustering algorithm according to characteristics of network discrete text based on characteristic concept network. This clustering algorithm integrates the efficiency of k-means, the parallel global search ability of genetic algorithms and the capability to maintain population diversity of Niche method to cluster texts. And in the classification algorithm, the sub-category is clustered into the training library first and then the text is classified by using KNN algorithm. Finally, some improvements are given.

同期刊论文项目
期刊论文 49 会议论文 5 获奖 1 专利 6 著作 1
同项目期刊论文
期刊信息
  • 《信息安全与通信保密》
  • 主管单位:中国电子科技集团公司
  • 主办单位:中国电子第三十研究所
  • 主编:惠志斌 鲁传颖
  • 地址:四川成都市高新区创业路8号
  • 邮编:610041
  • 邮箱:
  • 电话:028-88203306 85169935
  • 国际标准刊号:ISSN:1009-8054
  • 国内统一刊号:ISSN:51-1608/TN
  • 邮发代号:62-208
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:7388