位置:成果数据库 > 期刊 > 期刊详情页
基于HGSD的消费情感分类算法
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]辽宁工程技术大学软件学院,葫芦岛125100, [2]辽宁工程技术大学系统工程研究所,葫芦岛125100
  • 相关基金:国家自然科学基金项目(No.70971059)、辽宁省创新团队项目(No.2009T045)、辽宁省高等学校杰出青年学者成长计划项目(No.LJQ2012027)资助
中文摘要:

针对中文消费评价的情感分类问题,构造基于词典语义概念和上下文语义相结合的情感分类方法,对情感进行分类。该方法首先构造提取不同领域基准词集的方法。然后利用一元语言模型,通过HowNet计算情感相似值,进行情感词提取。最后结合HowNet方法和Google相似距离方法构造一种情感分类算法,对句子进行情感倾向性分类,既考虑词语本身含义,又考虑词语在上下文中的含义。通过对书籍、电脑和酒店的评价进行实验,F值较高,同时与其他方法进行对比实验,体现文中算法的有效性。

英文摘要:

Aiming at the sentiment classification for Chinese consumption comments, a sentiment classification method combining dictionary semantic concept and context semanteme is proposed. Firstly, a method of extracting benchmark words set of different domains is put forword. Then, the sentiment words are extracted through the similarity of HowNet based on the unigram model. Finally, HowNet and Google similarity distance ( HGSD ) combining the HowNet similarity and the Google similarity distance is presented to classify the sentences, which reflects the original meaning of the word and the meaning in the context. Experiments of consumption comments on books, computers and hotels show the higher F-measure of the proposed method, and meanwhile the contrast experiment shows the effectiveness of the proposed algorithm.

同期刊论文项目
期刊论文 60 会议论文 9
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169