位置:成果数据库 > 期刊 > 期刊详情页
基于情绪词的非监督中文情感分类方法研究
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:2012.8.8
  • 页码:103-108
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]苏州大学计算机科学与技术学院,江苏苏州215006, [2]江苏省计算机信息处理技术重点实验室,江苏苏州215006
  • 相关基金:国家自然科学基金(60970056,61070123,61003155);高等学校博士学科点专项科研基金(20093201110006);模式识别国家重点实验室开放课题基金
  • 相关项目:多文档事件信息融合方法的研究
中文摘要:

情感分类任务旨在识别文本所表达的情感色彩信息(例如,褒或者贬,支持或者反对)。该文提出一种基于情绪词的中文情感分类方法,使用大规模未标记数据和少量情绪词实现情感分类。具体来讲,首先使用情绪词从未标注数据中抽取高正确率的自动标注数据作为训练样本,然后采用半监督学习方法训练分类器进行情感分类。实验表明,该文提出的方法在产品评论与酒店评论两个领域的情感分类任务中取得了较好地分类效果。

英文摘要:

Sentiment classification is to distinguish the text between the expressed sentiment categories,such as positive vs.negative or agree vs.disagree.This paper aims to perform unsupervised sentiment classification with only unlabeled data and a small scale of emotion words.In detail,we firstly adopted the emotion words to extract the automatically-labeled samples with high precision,and then used these samples with the unlabeled samples to perform semi-supervised learning for sentiment classification.Experimental results demonstrate that this approach can achieve a good performance for the task of sentiment classification in both product and hotel domains.

同期刊论文项目
期刊论文 26 会议论文 13 专利 6
期刊论文 26 会议论文 9 专利 2
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136