位置:成果数据库 > 期刊 > 期刊详情页
基于主题的舆情跟踪方法研究及性能评价
  • ISSN号:0252-3116
  • 期刊名称:《图书情报工作》
  • 时间:0
  • 分类:G350[文化科学—情报学]
  • 作者机构:[1]中国科学技术信息研究所,北京100038, [2]北京工业大学计算机学院,北京100124
  • 相关基金:本文系国家自然科学基金青年基金项目“问答式信息检索中信息抽取技术研究”(项目编号:60803086)和北京市自然科学基金项目“语义蕴涵推理技术及在问答式信息检索中的应用研究”(项目编号:4123091)研究成果之一.
中文摘要:

舆情跟踪是对媒体信息流中的热点话题进行实时追踪,是近年来自然语言处理领域的研究热点。实现该任务的核心技术是进行文本分类,运用信息增益以及互信息计算特征项权重,提取向量空间模型中文档表示的有效特征;分别采用Rocchio、K—Nearest Neighbor(KNN)、Bayes方法对于给定主题的事件实现舆情跟踪。在测试集上的最优性能F-Measure值达到86.2%。舆情跟踪在信息安全等领域具有广阔的应用前景,为用户及时判断网络热点事件的发展趋势提供有效指导依据。

英文摘要:

The aim of the public opinion tracking is to make tracks for the progress of the appointed hot topic in the information flow of the media, and this has becomes the hotspot research direction in the field of natural language processing in recent years. The key technique to achieve the task is text classification. The authors adopt different methods of information gain and mutual information for the feature selection within the vector space model. They are used for the weight calculation and the effective features with higher weight values are extracted. The approach of Rocchio, KNN and Bayes are adopted to implement the public opinion tracking on a given topic events. Finally, the authors give the statistical data analysis and achieve the performance of 86.2% F-Measure on the test set. Public opinion tracking has a broad application prospect in the areas of information security and so on. It provides the effective guidance for the determination to the development trend of the network hot events.

同期刊论文项目
期刊论文 19 会议论文 10
同项目期刊论文
期刊信息
  • 《图书情报工作》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院文献情报中心
  • 主编:初景利
  • 地址:北京中关村北四环西路33号
  • 邮编:100190
  • 邮箱:journal@mail.las.ac.cn
  • 电话:010-82623933 82626611-6614
  • 国际标准刊号:ISSN:0252-3116
  • 国内统一刊号:ISSN:11-1541/G2
  • 邮发代号:2-412
  • 获奖情况:
  • 多次荣获"全国图书馆学优秀期刊"、"全国优秀科技...,2005年,更荣获中国国家期刊奖二等奖,是本届唯一...
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:57601