位置:成果数据库 > 期刊 > 期刊详情页
考虑观点多样性的评论选择问题
  • ISSN号:1000-1239
  • 期刊名称:计算机研究与发展
  • 时间:0
  • 页码:-
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华东师范大学软件学院,上海200062, [2]复旦大学计算机科学技术学院,上海200433
  • 相关基金:国家自然科学基金项目(61103039);国家自然科学基金重点项目(61232002);武汉大学重点实验室开放基金项目(SKLSE2012-09-16)
  • 相关项目:支持WEB服务搜索的情境数据管理
中文摘要:

在线用户评论向消费者提供了丰富的商品信息,帮助他们挑选从日常用品到娱乐活动相关的商品.然而,评论的数量之大让用户难以对商品有一个清晰的认识.现有解决电子商务网站中评论信息过载问题的方法包括评估评论质量以及总结评论观点等.但是,基于评论质量排序的方法可能信息冗余,而评论总结方法忽视上下文导致易读性较差.因此,需要实现有效的评论选择方法.设计了基于字典和规则以及基于主题模型LDA的观点获取算法来形式化地表示每条评论;提出一种基于贪心算法的评论选择方法,实现从商品评论集中选择一组高质量的评论,并最大化评论集的商品属性覆盖度和评论观点多样性.最后在真实数据集上对算法进行实验来验证该算法,实验结果表明了该算法的有效性.

英文摘要:

Online user-generated reviews provide consumers with abundant information, which influences their shopping decisions on a variety of products from daily consumption to entertainment. Due to the sheer size of the reviews, users are prevented from a clear picture of products. In fact, it is not easy for them to go through all reviews for each item. Existing solutions to information overload in ecommerce sites include estimating the quality of reviews and summarizing the opinions from the reviews. However, review ranking based on review quality may lead to information redundancy while review summarization fails to provide the context of reviews, resulting in poor readability. To this end, the paper aims at implementing an effective review selection method. We design two opinion extraction algorithms, which are dictionary and rule-based, and LDA-based respectively, to represent each review. A greedy approach is proposed to select a small set of high quality reviews for each product, and to maximize both the attribute coverage and opinion diversity. A set of experimental results on real datasets show that the proposed method is effective, and for the two opinion extraction algorithms, the dictionary and rule-based algorithm performs better than the LDA-based algorithm in solving review selection problem.

同期刊论文项目
期刊论文 36 会议论文 16 获奖 4 著作 1
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349