位置:成果数据库 > 期刊 > 期刊详情页
面向特定领域的产品评价对象自动识别研究
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:89-93
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西大学数学科学学院,山西太原030006, [2]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006
  • 相关基金:基金项目:国家自然科学基金资助项目(60875040,60970014);教育部高等学校博士点基金资助项目(200801080006);山西省自然科学基金资助项目(2007011042);教育部科学技术研究重点基金资助项目(2007018);山西省重点实验室开放基金资助项目(2007031017);太原市科技局明星专项(09121001)
  • 相关项目:基于多层次语言粒度的文本情感分类研究
中文摘要:

产品评价对象的自动识别是文本观点信息抽取和倾向性分析中的重要研究课题之一。该文针对汽车评论,提出了一种不依赖外部资源的无指导评价对象自动识别方法。该方法首先综合使用词形模板和词性模板,采用模糊匹配方法和剪枝法抽取候选评价对象。然后,从候选对象集中,采用双向Bootstrapping方法识别出产品评价对象。最后,通过采用K均值聚类方法对产品评价对象进行聚类,实现从评价对象中自动抽取产品名称和产品属性。实验结果表明,该方法对产品评价对象识别的F值达到58.5%,产品名称识别的F值达到69.48%。

英文摘要:

The comment target recognition for the products is one of the important topics in text opinion information extraction and the sentiment analysis. For car product reviews, this paper proposes an unsupervised method to recognize comment targets without relying upon additional resources. In this method, we employ the fuzzy match technique for the word templates and part of speech templates and the pruning technique to extract candidate evaluated objects. Then the bidirectional Bootstrapping approach is used to recognize the comment targets from the candidate set. Lastly, the comment targets of the products are clustered by the K means method to recognize the product name and the product attributes. The experimental results indicate that the F-value of the recognition of the comment targets and the product names can achieve 58.5% and 69.48% respectively.

同期刊论文项目
期刊论文 35 会议论文 12 专利 3
期刊论文 62 会议论文 2 获奖 2 专利 1
同项目期刊论文