位置:成果数据库 > 期刊 > 期刊详情页
基于LDA模型的评论热点挖掘:原理与实现
  • ISSN号:1000-7490
  • 期刊名称:情报理论与实践
  • 时间:0
  • 页码:-
  • 分类:F840.69[经济管理—保险]
  • 作者机构:[1]上海理工大学管理学院,上海200093
  • 相关基金:本文为国家自然科学基金资助项目(项目编号:70903047),上海市重点学科建设项目(项目编号:S30501,J50504)和上海市第三期本科教育高地建设项目(电子商务)的研究成果之一.
  • 相关项目:WEB2.0环境下基于本体学习的观点挖掘研究
中文摘要:

本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。

英文摘要:

This paper presents an approach to mining the hot topics of user comment which combines the Latent Diriehlet Allocation (LDA) model with natural language processing technologies. To verify the validity of the proposed approach, 22 157 comments on restaurants are taken as samples to obtain the hot topics of user comment and their relevant hot words by the use of the Gibbs sampling-computed parameters. The obtained 9 topics reflect the hot topics of user comments on restaurants relatively satisfactorily, and are basically consistent with what the users care about in restaurants in their real life, which shows that this model has a good effect in mining hot topics.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报理论与实践》
  • 北大核心期刊(2011版)
  • 主管单位:中国兵器工业集团公司
  • 主办单位:中国国防科学技术信息学会 中国兵器工业集团第二一零研究所中国兵器工业第二一0研究所
  • 主编:王忠军
  • 地址:北京2413信箱10分箱
  • 邮编:100089
  • 邮箱:ita@onet.com.cn
  • 电话:010-68961793 68963306
  • 国际标准刊号:ISSN:1000-7490
  • 国内统一刊号:ISSN:11-1762/G3
  • 邮发代号:82-436
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:26785