位置:成果数据库 > 期刊 > 期刊详情页
基于多特征融合的微博主题情感挖掘
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]东北大学计算机科学与工程学院,沈阳110819, [2]福建师范大学软件学院,福州350108, [3]医学影像计算教育部重点实验室(东北大学),沈阳110819, [4]福建省公共服务大数据挖掘与应用工程技术研究中心,福州350108
  • 相关基金:国家自然科学基金(61370074)资助
中文摘要:

微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主题是密切相关的.多数现有的微博情感分析方法都没有将微博主题与微博情感进行协同分析,或者在微博主题情感分析过程中没有考虑将用户关系、用户性格情绪等特征数据,从而导致微博情感分析与主题检测的效果难尽人意.为此,提出了一个基于多特征融合的微博主题情感挖掘模型TSMMF(Topic Sentiment Model based on Multi-feature Fusion),该模型将情感表情符号与微博用户性格情绪特征纳入到图模型LDA中实现微博主题与情感的同步推导.实验结果表明,与当前用于短文本情感主题挖掘的最优模型(JST,SLDA与DPLDA)相比较,TSMMF具有更优的微博主题情感检测性能.

英文摘要:

Sentiment analysis in microblogging is an important task in mining social media,and has important theoretical and application value in the terrorist organization identification,personalized recommendation,public opinion analysis,etc.However,different from traditional texts,messages in microblogging are short and irregular,and contain multifarious features such as emoticons,update time and etc,and in microblogging sentiment of a message is closely related to its topic.Most existing sentiment mining approaches cannot achieve cooperating analysis of topic and sentiment of messages in microblogging,or do not take factors such as social relations and users emotional personality into consideration,and this may lead to unsatisfactory sentiment classification and topic detection.To address the issues,aprobabilistic model,TSMMF(Topic Sentiment Model based on Multi-feature Fusion)is proposed,which introduces emoticons and microbloggers personality into LDA inference framework,models emotion and personality of microbloggers under the guidance of emotional psychology theory,uses social relations among microbloggers to initialize topics of messages,utilizes Gibbs sampling techniques to estimate parameters in themodel,and finally achieves synchronized detection of sentiment and topic in microblogging.Extensive experiments show that TSMMF outperforms state of-the-art unsupervised approaches JST,SLDA and DPLDA significantly in terms of sentiment classification accuracy,and compared to the typical semi-supervised sentiment analysis algorithm SSA-ST,TSMMF performs as well as SSA-ST,but unlike SSA-ST,TSMMF can work without labeled training datasets.And so it has promising performance.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433