位置:成果数据库 > 期刊 > 期刊详情页
基于词典与机器学习的中文微博情感分析研究
  • ISSN号:1000-386X
  • 期刊名称:计算机应用与软件
  • 时间:2014.7.15
  • 页码:177-181
  • 分类:H315.9[语言文字—英语]
  • 作者机构:[1]北京信息科技大学信息与通信工程学院,北京100101, [2]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101
  • 相关基金:国家自然科学基金项目“基于本体的专利自动标引研究”(项目编号:61271304)和北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目“面向领域的互联网多模态信息精准搜索方法研究”(项目编号:KZ201311232037)的成果.
  • 相关项目:网页内容真实性评价研究
中文摘要:

[目的/意义]面向电子商务领域的在线评论,通过识别产品特征和评价词之间是否存在修饰关系,抽取出在线评论中的情感标签,从而帮助网购用户迅速了解某一产品的性能。[方法/过程]引入汉语组块分析对评论文本进行初始化处理,对名词性信息以及形容词性信息进行抽取。通过最大熵对初始化集合进行过滤,从而获得最终的情感标签集合。[结果/结论]该方法对评论文本的适应性较好,可以有效抽取出情感标签。[局限]需要对语料进行初始化抽取,经过过滤后才能获得最终的情感标签集合。

英文摘要:

[ Purpose/significance] For online reviews in the fields of E-commerce, rely on the existence of a modified rela- tionship between the identification and evaluation of product features, this paper extracts emotional label of online reviews to help online shoppers to quick understand the performance of a product. [ Method/process ] Chinese chunking is being used to analyze the structure of online reviews, then, the paper extracts the nominal information and adjective information from the reviews. Using the maximum entropy model to filter the candidate set, in order to get the final emotional label sets. [ Result/conclusion ] This methods has better result on reviews, it can effectively extracts the emotional label. [ Limitations ] The paper needs to be initialized corpus extraction, which can obtain a final emotional label collection after filtration.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463