位置:成果数据库 > 期刊 > 期刊详情页
停用词表对基于SVM的中文文本情感分类的影响
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉科技学院经济管理学院,武汉430073, [2]武汉科技学院商务智能与数据挖掘实验室,武汉430073
  • 相关基金:国家社会科学基金(07BTQ010); 湖北省课题(Z20091701 2008d062 2008244 2007097 HB092-21); 武汉市课题(200940833384-02 20041007072-08); 中国纺织工业协会(2007082)支持
中文摘要:

运用非结构化信息挖掘,对网络评论情感进行分析是一个非常重要的方法。本文基于Web客户评论情感文本,在情感文本预处理过程中使用四种不同的停用词表,采用两种不同的特征选择方法,选用著名的TF-IDF权重计算方法,使用基于RBF核函数的支持向量机方法的分类器实现了对携程网上采集的4000个酒店客户评论情感文本的分类研究。通过实验,分析了不同特征选择方和停用词表的使用对客户评论文本情感分类的影响,提出了基于情感文本分类的有效的停用词表。

英文摘要:

It is an important method to analyse Web reviews' sentiment categorization with unstructured information date mining.This paper based on the Web text reviews,using four different kinds of stop word removal way,two kinds of feature selection methods,the famous TF-IDF weighing assignment methods and the SVM(support vector machine) technology with the RBF kernel function categorize the 4,000 customer reviews text grasp on XIECHENG.With the results of the experiment,this paper analysis the influence of different kinds of feature selection methods and stop word removal on the Chinese text sentiment classification,represent the more effective stop word removal list.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778