位置:成果数据库 > 期刊 > 期刊详情页
电子商务中基于非均衡数据分类和词性分析的意见挖掘研究
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:F713.36[经济管理—产业经济]
  • 作者机构:[1]合肥工业大学管理学院,合肥230009, [2]过程优化与智能决策教育部重点实验室,合肥230009, [3]中国科学院数学与系统科学研究院预测科学研究中心,北京100190
  • 相关基金:国家自然科学基金(71101042,71271202);高等学校博士学科点专项科研基金(20110111120014);中国博士后科学基金(2011M501041,2013T60611);国家重点基础研究发展计划(973计划)(2013CB329603).
中文摘要:

随着电子商务的不断普及,网络商品评论作为消费者了解网上销售商品质量的一个重要途径,已受到越来越多的重视,并且已提出很多意见挖掘方法来帮助消费者利用这些数据。但目前研究对网络商品评论的非均衡分布特性还较少关注,为此,本文提出基于非均衡数据分类和词性分析的意见挖掘方法。该方法综合基于情感知识和机器学习两种意见挖掘方法,首先,分析电子商务评论的语言特征,对电子商务评论中词语的词性进行分析,提出“留词性”和“去词性”两种分析方法;其次,根据电子商务意见挖掘数据不均衡分布的特征,提出基于非均衡数据分类的意见挖掘方法。最后,以携程网、京东商城和当当网三个不同电子商务网站的用户评论为语料库,对本文提出的方法进行检验,实验结果验证了本文提出的基于非均衡数据分类和词性分析的意见挖掘方法的有效性,并且采用去词性分析方法时,Random Subspace在所有测试集上均取得了最好的分类结果。

英文摘要:

With the popularization of electronic commerce, product reviews in the Internet are paid more and more attention when customers want to know the quality of products. Meanwhile, a lot of opinion mining techniques have been proposed to help customers to analyze these huge data. However, the imbalanced distribution of review datasets is paid less attention to. In this paper, a new method based on sentiment knowledge and machine learning is proposed. Firstly, two methods, i.e. , "reserved POS method" and "left POS method" , are used to analyze the POS of product reviews. Then, an new opinion mining method is proposed based on imbalanced data classification. Lastly, experiments using Ctrip dataset, JD dataset, and DangDang dataset, are conducted to verify the effectiveness of the proposed method. Experimental results reveal that the new method based on imbalanced data classification and POS analysis is effective to the opinion mining. And the best result was gotten when using Random Subspace and "left POS method".

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778