位置:成果数据库 > 期刊 > 期刊详情页
基于加权SimRank的跨领域文本情感倾向性分析
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]大连理工大学计算机科学与技术学院大连116024
  • 相关基金:国家自然科学基金项目(No.60673039,60973068)、国家社会科学基金项目(No.OSBTQOZ5)、教育部留学回国人员科研启动摹拿项目、高等学校博士学科点专项科研基金项目(No.20090041110002,20110041110034)资助
中文摘要:

近年来,跨领域文本倾向性分析已成为自然语言处理领域的一个研究热点.它利用已经标注倾向性的源领域文本,预测目标领域文本的倾向性.然而,由于不同领域的数据往往服从不同的分布,导致传统的监督分类模型通常不能取得理想的效果.为解决以上问题,提出了一种基于加权SimRank的分析模型.本模型在加权SimRank算法的基础上,构建潜在特征空间,然后在潜在特征空间下学习得到映射函数,并对每个样本重新映射,从而缩小了不同领域间的数据分布差异,实现了跨领域情感分类.最后,通过实验验证了该方法的有效性.

英文摘要:

Cross-domain sentiment classification has attracted more attention in natural language processing field currently. It aims to predict the text polarity of target domain with the help of labeled texts in source domain. Usually, traditional supervised classification approaches can not perform well due to the difference of data distribution between domains. In this paper, a weighted SimRank algorithm is proposed to address this problem. The weighted SimRank algorithm is applied to construct a Latent Feature Space (LFS) with feature similarity. Then each sample is reweighted by the mapping function learned from the LFS. After reducing the mismatch of data distribution between domains, the algorithm performs well on cross-domain sentiment classification. The experiment verifies the effectiveness of the proposed algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169