位置:成果数据库 > 期刊 > 期刊详情页
融合显性和隐性特征的中文微博情感分析
  • ISSN号:1003-0077
  • 期刊名称:《中文信息学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:浙江工业大学计算机科学与技术学院,浙江杭州310023
  • 相关基金:国家自然科学基金重点支持项目-NSFC-浙江两化融合联合基金(U1509214)
中文摘要:

微博情感分析是研究社交网络舆情的一项关键技术。微博表情符号和情感词汇等是一类直观显性的情感特征,而微博的内容语义则可视为隐性特征,且对情感判定往往具有决定性作用,因此本文提出将两类特征因素融合的微博情感分析方法。首先构建情感分析词典、网络用语词典以及表情符号库,定义微博频繁特征词集,再根据频繁特征词集,利用最大频繁项集获得微博初始情感簇;针对初始簇间存在文本重叠情况,提出基于短文本扩展语义隶属度的簇间重叠消减算法,获得完全分离的初始簇;最后根据簇语义相似度矩阵,给出一种凝聚式情感聚类方法。利用NLPCC2013评测所提供的训练语料进行情感分类实验,说明了分析该文方法的性能优势,并以2014年3月8日马航事件微博数据为例,给出了利用微博情感分析公众随事态发展的情感变化,说明了该文方法的实用效果。

英文摘要:

Micro-blog sentiment analysis is a key technique of public opinion research for social networks.Micro-blog emoticons and sentiment words are both of intuitive called as explicit emotion features,while the content semantics are called implicit features which sometimes are very important for micro-blog emotion discrimination.Therefore,in this paper,a new systematic methodology for sentiment analysis is proposed using both explicit and implicit emotion features.At first,the sentiment analysis dictionary,the glossary of social networking terms,as well as the emoticon library,are all initialized.Then,the text micro-blog frequent word sets are defined.According to the feature set of words,the initial micro-blog clusters can be directly generated depending on the maximum frequent item sets.Furthermore,as to solve the micro-blog overlap problem between multiple initial clusters,an efficient elimination method is proposed employing the extended membership degree of the short-message semantic.Finally,the semantic similarity matrix for each separated cluster is defined,based on which a hierarchical sentiment clustering for microblogs is conducted.Taking the well-known contest NLPCC2013 in China as instance,the efficiency of our proposed method is proved by the comparing experiments.At last,a real-world case is also done to exactly show the emotion change from Chinese micro-blogs for the Malaysia Airlines Disappear Incident during March 8to Spril 8,2014

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136