位置:成果数据库 > 期刊 > 期刊详情页
基于多重冗余标记CRFs的句子情感分析研究
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:75-82
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100080
  • 相关基金:国家自然科学基金资助项目(60673042);北京市自然科学基金资助项目(4052027,4073043)
  • 相关项目:汉语文本中观点信息的提取与倾向性分析技术研究
作者: 王根|赵军|
中文摘要:

本文提出了一种基于多重冗余标记的CRFs并将其应用于情感分析任务。该方法不仅能够有效地解决有序标记的分类问题,还能够在保证情感分析中各子任务能够使用不同特征的前提下,将情感分析中的主客观分类、褒贬分类和褒贬强弱分类任务统一在一个模型之中,在多个子任务上寻求联合最优,制约分步完成时误差的传播。实验证明,该方法有效地提高了句子情感分析任务的准确率。在理论上,该方法也为基于最大似然训练的算法解决序回归问题提供了一条途径。

英文摘要:

This paper proposes a new method called Multi-redundant-labeled CRFs and applies it on sentence sentiment analysis. This method can not only solve ordinal regression problems effectively, but also obtain global optimal result over multiple cascaded subtasks by merging subjective/objective classification, polarity classification and sentimental strength rating into an integrated model, with each subtask maintaining its own feature types. Experiments on sentiment classification of sentences show a better performance than standard CRFs, and thus validate the effectiveness of this method. Additionally, this method theoretically provides a way to solve ordinal regression problems for the algorithms whose training is based on maximization likelihood estimation.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136