位置:成果数据库 > 期刊 > 期刊详情页
中文微博情感词典构建方法
  • ISSN号:1672-3961
  • 期刊名称:《山东大学学报:工学版》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]广东外语外贸大学思科信息学院,广东广州510006, [2]广东外语外贸大学管理学院,广东广州510006
  • 相关基金:国家社科基金资助项目(12BYY045);教育部人文社会科学研究青年项目(10YJCZH247);广东省科技计划资助项目
中文摘要:

提出了一种中文微博情感词典构建方法。采用上下文熵的网络用语发现策略,通过 TF-IDF(term frequency-inverse document frequency)进行二次过滤得到网络用语;利用 SO-PMI(semantic orientation-pointwise mutual infor-mation)算法在已标注的微博语料库中计算网络用语的情感倾向值,构建网络用语情感词典;将词典应用到微博情感分类实验,并与朴素贝叶斯分类器的分类性能进行了比较分析。实验结果表明,直接利用微博情感词典的分类效果好于朴素贝叶斯分类器,并具有分类过程简单、快速等优势。

英文摘要:

A method of building Chinese microblog sentiment lexicon was proposed,which adopted the discovery strategies of context entropy for network language, acquired network languages from the secondary filtration by TF-IDF and computed the sentiment weights of network language by SO-PMI algorithm in the labeled corpus.The built lexicon was applied into the analysis experiments of micro-blog sentiment,which was compared with that of naive bayesian classifier.Experiment results showed that the efficacy of classification by the built micro-blog sentimental lexicon was better than that by naive bayesian classifier,and was simple and rapid in the classification process.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《山东大学学报:工学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:山东大学
  • 主编:李术才
  • 地址:山东济南市经十路17923号
  • 邮编:250061
  • 邮箱:xbgxb@sdu.edu.cn
  • 电话:0531-88396452
  • 国际标准刊号:ISSN:1672-3961
  • 国内统一刊号:ISSN:37-1391/T
  • 邮发代号:24-221
  • 获奖情况:
  • 国内外数据库收录:
  • 美国化学文摘(网络版),波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:6258