位置:成果数据库 > 期刊 > 期刊详情页
基于微博转发集的微博过滤研究
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京信息科技大学网络文化与数字传播北京市重点,实验室北京100101, [2]新华网络股份有限公司,北京100101
  • 相关基金:国家自然科学基金项目(61271304);国家科技支撑计划课题(2011BAHllB03);北京市教委科技发展计划项目(KM201211232023).
中文摘要:

微博客是近年来自然语言处理领域研究的热点。主要针对中文微博客中的情感分类展开研究。结合网络新词和基础情感词,同时考虑了情感词的极性情感强弱,构建四个词典,分别是基础情感词典、表情符号词典、否定词词典和双重否定词词典;在情感词典的基础上’,融合汉语语言学特征和微博情感表达特征,提出一种新的基于极性词典的情感分类方法。实验准确率达到82.2%。实验结果表明,提出的方法可以对中文微博进行较好的情感分类,有一定的应用价值。

英文摘要:

Microblogging is the focus in research field of natural language processing recently. Our study in this paper is mainly in regard to the sentiment classification of Chinese microblog. In combination with new Internet words and basic emotional words and taking into account the strength of the polarity of emotions, we construct four lexicons, they are : the basic sentiments lexicon, emotional signs lexicon, negative words lexicon and double negative words lexicon respectively. On the basis of sentiments lexicon and fused in Chinese linguistic features and the sentiment expression features in microblogging, we propose a new sentiment classification method based on polarity lexicons. The precision in the experiments reaches 82. 2%. Experimental result indicates that the method proposed in the paper can conduct the sentiment classification on Chinese microblog well, and has certain applied value.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778