位置:成果数据库 > 期刊 > 期刊详情页
基于混合语言信息的词语搭配倾向判别方法
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:69-74
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西大学数学科学学院,山西太原030006, [2]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006
  • 相关基金:国家自然科学基金资助项目(60875040,60970014);教育部高等学校博士点基金(200801080006);山西省自然科学基金资助项目(2007011042);教育部科学技术研究重点基金资助项目(2007018);山西省重点实验室开放基金资助项目(2007031017);太原市科技局明星专项(09121001)
  • 相关项目:基于多层次语言粒度的文本情感分类研究
中文摘要:

具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。

英文摘要:

The collocations with strong sentiment orientation are important for the text sentiment analysis. In this paper, a method of collocation orientation identification based on hybrid language information is proposed. Firstly, according to the characteristics of six kinds of collocation patterns, the probability latent semantic models are determined for them. Then the obtained semantic models were used to identify the sentiment orientations of collocations. Lastly, for some collocations containing a sentiment word, their previous tags were modified by using some constructed rules. The experiment result in the corpus of ear reviews indicates that the proposed method is superior to the method based only on probability latent semantic model or rule for collocation orientation identification.

同期刊论文项目
期刊论文 62 会议论文 2 获奖 2 专利 1
期刊论文 35 会议论文 12 专利 3
同项目期刊论文