位置:成果数据库 > 期刊 > 期刊详情页
基于LDA和SNA的在线新闻热点识别研究
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:G206[文化科学—传播学]
  • 作者机构:[1]同济大学经济与管理学院,上海200092, [2]上海通用汽车销售有限公司,上海201206
  • 相关基金:国家自然科学基金项目(71371144),上海市哲学社会科学规划课题一般项目(2013BGL004),山东省统计科研重点课题一般项目(KT15073).
中文摘要:

准确识别在线新闻的热点话题,有助于政府了解社会动向、企业洞察消费需求、学者追踪研究热点。为此,提出一种基于隐含狄利克雷分布和社会网络分析的在线新闻文本热点挖掘模型。首先,借助LDA主题模型对同一时期某一领域的新闻文本进行主题词提取,形成主题词共现结构网络。然后,采用社会网络分析方法对共现网络进行分析,构造主题词语的社会网络结构图谱,进行中心性分析、核心-边缘分析和凝聚子群分析,并以“可持续发展”领域为例,对该领域的热点进行识别。最后,分别与TD—IDF和LDA的主题抽取方法对比,并结合百度指数的验证,发现本文的方法能够有效地反映词语的重要程度和分布情况,具有较强的可移植性。

英文摘要:

The purpose of paper is to identify hot topics of online news accurately, it is of great reference value for government to understand the social dynamics, enterprise to get consumers' demand, and researcher to find research hotspot. In this paper, a model for mining hot topic of online news text based on Latent Dirichlet Allocation and Social Network Analysis is developed. Firstly, some topics of news text are extracted by LDA topic model at the same period, then topic co-occurrence network is made by SNA. We construct social network structure map and analysis node centricity, core- periphery and cohesive subgroup. And an experiment is conducted by online news text in the field of sustainable development. Finally, comparing with methods of extracting topic based on TD-IDF and LDA respectively, this method can reflect the degree of importance and distribution of words effectively by the verification of Baidu Index, and has strong portability.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778