位置:成果数据库 > 期刊 > 期刊详情页
基于赋权粗糙隶属度的文本情感分类方法
  • ISSN号:1000-1239
  • 期刊名称:计算机研究与发展
  • 时间:0
  • 页码:855-861
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西大学计算机与信息技术学院,太原030006, [2]计算智能与中文信息处理教育部重点实验室山西大学,太原030006, [3]科学出版社,北京100717
  • 相关基金:国家自然科学基金项目(60875040 60970014); 高等学校博士学科点专项科研基金项目(200801080006); 山西省自然科学基金项目(2007011042 2010011021-1); 山西省重点实验室开放基金项目(2007031017); 太原市科技局明星专项基金项目(09121001)
  • 相关项目:面向混合数据的粒度计算理论与方法研究
中文摘要:

提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到数据降维的目的.利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类.在真实汽车评论语料上,与支持向量机分类模型进行比较实验表明,基于赋权粗糙隶属度的文本情感分类方法在对数据进行一定程度的压缩后仍表现出较好的分类性能.

英文摘要:

Facing with promptly increasing reviews on the Web,it has been great challenge for information science and technology that how people effectively organize and process document data hiding large amounts of information to meet with particular needs.Text sentiment classification aims at developing some new theories and methods to automatically explore the sentiment orientation of a text by mining and analyzing subjective information in texts such as standpoint,view,attitude,mood,and so on.A method of text sentiment classification based on weighted rough membership is proposed in this paper.In the method,the model of text expression is established based on two-tuples attribute(feature,feature orientation intensity),by introducing feature orientation intensity into the method of vector space representation.An attribute discretization method is proposed based on the sentiment orientation sequence for feature selection unifying the discretization processing to depress data dimension.To utilize the feature orientation intensity,a weighted rough membership is defined for classifying new sentiment text.Compared with SVM classifier,on the reality car review corpus,the proposed method based on rough membership for text sentiment classification has the best performance after data being compressed in a certainty extent for text sentiment classification.

同期刊论文项目
期刊论文 62 会议论文 2 获奖 2 专利 1
期刊论文 35 会议论文 12 专利 3
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349