位置:成果数据库 > 期刊 > 期刊详情页
基于微博表情符号的情感词典构建研究
  • ISSN号:1001-0645
  • 期刊名称:《北京理工大学学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国人民大学信息学院,北京100872, [2]淮阴师范学院传媒学院,江苏,淮安223300
  • 相关基金:国家自然科学基金资助项目(60217289);北京市自然科学基金资助项目(4132067)
中文摘要:

基于微博表情符号,提出一种自动构建情感词典的方法.从微博平台抓取大量带有表情符号的微博文本,并依据表情符号对微博文本进行情感倾向标注,生成情感语料库.对语料库进行分词、去重等预处理工作,根据词性规则抽取微博文本中情感词,统计每个情感词在正向和负向语料库中出现的次数,计算情感词的卡方统计值获得情感强度,根据情感词在正负微博文本中出现的概率判定情感词的倾向性,进而生成情感词典.这是一种全新的思路.以人工标注的情感词典为基准数据,实验结果表明,本文方法标注情感词的准确率在80%左右,在情绪词强度阈值θ为20、30时,生成情感词典综合F值最好,达到了82%以上.

英文摘要:

A method for automatically building sentiment lexicon based on microblogging smiley was proposed.Firstly,a large number of microtext was crawled with emotions from the microblogging platform,the sentiment tendency was annotated based on the micro-smiley to generate emotion corpus.After some preprocessing such as segmentation and duplication removal have been done for the corpus,the sentiment word was then exacted according to rules of part of speech,statistics for each positive and negative emotion words in the corpus to calculate the sentiment value of the word chi-square statistic obtained emotional intensity;according to the positive and negative emotion words appear in the text microblogging the probability of emotional words tendentious was determined,thereby emotion dictionary was generated.This is a new way of thinking.With artificial sentiment dictionary marked as baseline data,the experimental results show that the accuracy of the proposed method marked the emotional words is about 80%,and when the intensity threshold of emotional words is 20,30,it gets the best F-value of generated emotional dictionary,reaching more than 82%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京理工大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国工业和信息化部
  • 主办单位:北京理工大学
  • 主编:黄风雷
  • 地址:北京海淀区中关村南大街5号
  • 邮编:100081
  • 邮箱:blgzw@bit.edu.cn
  • 电话:010-68912326 68913988
  • 国际标准刊号:ISSN:1001-0645
  • 国内统一刊号:ISSN:11-2596/T
  • 邮发代号:82-502
  • 获奖情况:
  • 全国优秀高等学校自然科学学报及教育部优秀科技期...,首届国家期刊奖提名奖,中文核心期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:17163