位置:成果数据库 > 期刊 > 期刊详情页
基于层叠CRFs模型的句子褒贬度分析研究
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:1-17
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100080
  • 相关基金:国家自然科学基金资助项目(60673042);北京市自然科学基金资助项目(4052027,4073043)
  • 相关项目:汉语文本中观点信息的提取与倾向性分析技术研究
作者: 刘康|赵军|
中文摘要:

本文研究句子的褒贬度分析问题。针对传统的基于分类的句子褒贬度分析方法不能考虑上下文信息的问题,以及基于单层模型的句子褒贬度分类方法中的由于标记冗余引起的分类精度不高问题,本文提出了基于层叠式CRFs模型的句子褒贬度分析方法。该方法利用多个CRFs模型从粗到细分步地判断句子的褒贬类别及其褒贬强度,其中层叠式框架可以考虑句子褒贬类别与褒贬强度类别之间的层级冗余关系,而CRFs模型可以利用上下文信息对于句子褒贬类别和强度的影响。该方法在有效识别句子褒贬度的同时,提高了句子褒贬强度判别的准确度。实验证明相对于传统分类方法和单层CRFs模型,本文的方法取得了良好的效果。

英文摘要:

This paper focuses on the task of sentence sentiment analysis. The traditional sentence sentiment analysis methods have the following two problems. First, the classification method cannot consider the contextual information; Second, the label redundancy in the single layer model has negative effect on the labeling accuracy of the second layer. Aiming at these two problems, this paper proposed a new sentence sentiment analysis method based on cascaded CRFs model, which used multiple CRFs models to compute sentence sentiment and sentiment strength in a cascaded way. The cascaded frame can alleviate the negative impact of related labels on the labeling accuracy, and on the other hand CRFs model can consider the contextual information. This method can improve the accuracy of sentence sentiment strength label while labeling sentence sentiment effectively. The experiments can validate this method. The performance of experiments can be improved greatly than SVM method and classical CRFs model.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136