位置:立项数据库 > 立项详情页
中文语境下基于模糊本体的用户在线评论的情感分析
  • 项目名称:中文语境下基于模糊本体的用户在线评论的情感分析
  • 项目类别:面上项目
  • 批准号:70971099
  • 申请代码:G011203
  • 项目来源:国家自然科学基金
  • 研究期限:2010-01-01-2012-12-31
  • 项目负责人:王洪伟
  • 负责人职称:副教授
  • 依托单位:同济大学
  • 批准年度:2009
中文摘要:

察言观色、情感领悟是CRM倡导的理念。随着电子商务可信性的提高,顾客在线评论的意愿更加强烈。但现有系统难以识别隐含在评论中的情感信息,从而导致应变能力弱和个性服务差。尤其是,中英文结构及中西方情感表露方式的差异,使得中文评论的情感识别更复杂。因此,中文语境下在线评论的情感分析尤为重要。本体有助于增强对情感型文本的语义理解,为此本课题以中文评论为对象,引入模糊理论,将传统本体模型扩展为基于多值逻辑的模糊本体,对模糊本体的微观结构与检验机制展开研究;结合管理学和心理学知识,创建情感模糊本体;针对中文评论的语法特点,借助模糊情感本体中术语及其关系,结合中文文本挖掘方法,分析在线评论的用户情感状态及程度,揭示情感演化规律;以手机产品评论为对象,通过实验对比验证方法的有效性。课题将从理论上充实本体建模的框架,丰富中文语境下情感计算的研究体系。实践上,对新一代情感认知的电子商务设计提供借鉴。

结论摘要:

在线评论影响消费者的购买决策。然而,面对非结构化的评论,商家对用户观点的自动识别束手无策,潜在消费者对海量评论的采纳倍感困惑。本体有助于增强对情感型文本的语义理解,已被应用到在线评论的情感分类。然而传统的本体模型基于二值逻辑,难以描述情感领域的模糊性概念及相互关系。为此,以中文在线评论为对象,引入模糊理论,将传统本体模型扩展为基于多值逻辑的模糊本体;结合组织行为理论,利用知网工具,创建模糊情感本体;针对中文评论的语法特点,借助模糊情感本体,利用文本挖掘方法,从段落级、句子级和词语级不同粒度,分析中文在线评论的用户情感极性及强度。成果如下(1)针对模糊性概念的表示问题,对描述逻辑语言进行层次性的扩展,实现了不同的模糊语义表达能力。借鉴已有的本体建模方法,应用模糊描述逻辑构建了模糊本体模型,并利用NGD算法确定隶属度。(2)基于模糊本体模型,借鉴知网等语义词典,建立模糊情感本体。运用模糊化处理和语义相似度方法,对评价词本体和情感词本体的情感类型和隶属度进行处理,最终形成模糊情感本体库。(3)利用模糊情感本体库获取评价词和情感词语义信息,从段落级、句子级和词语级三种粒度,以手机、酒店、婚纱摄影评论为实验对象,对中文在线评论的情感分类展开研究。段落级研究对在线评论的整体进行情感分类,提出情感特征项提取、降维、权重赋值方法,并对分类器进行改进;句子级研究以句子为单位将整段评论划分,提出基于句子情感的在线评论情感极性合成方法;词语级粒度研究从产品特征观点对的识别入手,提出面向产品特征的在线评论情感极性分类方法以及基于情感词的在线评论情感强度分析方法。(4)将情感分析应用到公众情感演化研究上,以温州“动车事故”为对象,对事故后公众微博进行情感分析。借助模糊情感本体库,提取8维情感类(期待,高兴,喜爱,惊讶,焦虑,悲伤,生气和憎恨),建立微博文本的影响力和情感计算方法,对“动车事故”的公众情感随事态发展的演化规律进行分析。(5)将情感分析应用到商家业绩分析中。在考虑线上与线下双渠道竞争情况下,提出基于在线评论的动态定价模型,分析网上零售商的定价策略;以电影票房为对象,引入影评情感因素为内生变量,通过建立联立方程模型,分析了在线评论和票房销售的关系。理论上,充实了本体建模的框架,丰富了中文在线评论情感分析的研究体系。实践上,对新一代情感认知的电子商务设计提供了借鉴。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 54
  • 7
  • 0
  • 0
  • 2
期刊论文
相关项目
期刊论文 14 会议论文 7 著作 2
期刊论文 44 会议论文 8 获奖 1
期刊论文 36 会议论文 3 获奖 1 著作 1
王洪伟的项目