位置:成果数据库 > 期刊 > 期刊详情页
文本情感倾向性分析方法:bfsmPMI-SVM
  • ISSN号:1671-8836
  • 期刊名称:《武汉大学学报:理学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉大学计算机学院,湖北武汉430072, [2]武汉大学国际软件学院,湖北武汉430079
  • 相关基金:国家自然科学基金资助项目(61303214,61672393,U1536204)
中文摘要:

为了提高文本情感倾向性分类的精度,提出了一种文本情感倾向性分析方法 bfsmPMI-SVM.该方法在文本预处理阶段,滤除了对表述主题情感倾向性不强烈的语句以及无关停用词等;用改进的PMI-IR算法对情感倾向性词语抽取,并自动扩充了正负基准词集;改进了互信息(MI)算法,在MI的计算中增加了词频因子(f)、类别差异因子(b)和符号因子(s).利用改进的MI算法选择文本特征,融合其他一些文本特征,用SVM实现文本情感倾向性分类.实验以食品安全领域爬取文本为例,与PMI-IR-SVM和MI-SVM算法的倾向分析相比,本文方法的正向文本准确率、负向文本准确率、召回率和F1值等都有提高.

英文摘要:

In order to improve the accuracy of text sentiment classification,this paper proposes a novel text sentiment analysis method bfsmPMI-SVM.At the preprocessing stage,the method filters out the stop words and the sentences with less emotional expressions to the themes.We also automatically extend the positive and negative base thesaurus using the extracted sentimental words by our improved PMI-IR algorithm.The Mutual Information(MI)algorithm is then improved by adding the frequency factor(f),difference factors(b)of categories of and symbol factor(s).Fused the features selected by MI with other features,the SVM is finally utilized to classify the texts.Compared with PMI-IR-SVM and IM-SVM,our method demonstrates the higher recall rate,F1 and higher accuracy for positive and negative text classification with the crawled texts from the field of food safety.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《武汉大学学报:理学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国2教育部
  • 主办单位:武汉大学
  • 主编:刘经南
  • 地址:湖北武昌珞珈山
  • 邮编:430072
  • 邮箱:whdz@whu.edu.cn
  • 电话:027-68756952
  • 国际标准刊号:ISSN:1671-8836
  • 国内统一刊号:ISSN:42-1674/N
  • 邮发代号:38-8
  • 获奖情况:
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:6988