位置:成果数据库 > 期刊 > 期刊详情页
基于直推式学习的中文情感词极性判别
  • ISSN号:1002-8331
  • 期刊名称:《计算机工程与应用》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]四川大学计算机学院,成都610065
  • 相关基金:国家自然科学基金重大研究计划项目(No.90409007)
中文摘要:

态度挖掘是近年来文本挖掘领域的热点课题之一,旨在发现文本中作者的主观态度倾向,为基于舆情的决策过程提供支持。目前已有的态度挖掘算法绝大多数都基于情感词典来识别情感词,在此基础上判别句子或文本的总体态度倾向。然而,手工构造和维护一部完善的情感词典是不现实的。对中文情感词的极性判别问题进行了研究,提出了基于直推式学习的中文情感词极性判别算法。该算法以少量情感词为种子,利用词典中词汇的解释信息,直推出其他词的情感极性。与使用相同情感种子词的解释信息作为训练数据的有监督学习算法相比,直推式学习算法的识别精度提高了20%左右。

英文摘要:

In recent years,opinion mining has become one of the hottest topics in the text mining field.It aims to discover the author's opinion polarity in texts and thus to provide support for decision-making process based on the public opinion.Up to now,most of the algorithms developed for opinion mining use an opinion word dictionary to identify the opinion words occurring in a sentence or text and then determine the polarity of the sentence or text based on polarities of these words.However,it's not realistic to construct and maintain manually a perfect opinion word dictionary.Therefore,the problem of determining the polarities of Chinese opinion words is investigated,and an algorithm based on transductive learning is proposed to solve the problem.This algorithm uses a few opinion words as seeds and performs polarity transduction from the seeds to other words based on their dictionary interpretations.Compared with supervised learning algorithms,which use the interpretations of the same seeds as the training data,the transduction-based algorithm has obtained an accuracy improvement of about 20%.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机工程与应用》
  • 北大核心期刊(2014版)
  • 主管单位:中国电子科技集团公司
  • 主办单位:华北计算技术研究所
  • 主编:怀进鹏
  • 地址:北京市海淀区北四环中路211号北京619信箱26分箱
  • 邮编:100083
  • 邮箱:ceaj@vip.163.com
  • 电话:
  • 国际标准刊号:ISSN:1002-8331
  • 国内统一刊号:ISSN:11-2127/TP
  • 邮发代号:82-605
  • 获奖情况:
  • 1. 2012年首批获得中国学术文献评价中心发布的 “...,2. 2001年获得新闻出版署“中国期刊方阵双效期刊”,3. 2008年首批入选国家科技部“中国精品科技期刊...,4.2003年-2011年连续获得工业和信息化部期刊最高...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:97887