位置:成果数据库 > 期刊 > 期刊详情页
问答社区中回答质量的评价方法研究
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:3-8
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]智能技术与系统国家重点实验室,清华信息科学与技术国家实验室(筹),清华大学计算机系,北京100084
  • 相关基金:国家自然科学基金资助项目(60736044 60903107); 教育部高等学校博士学科点专项科研基金资助项目(20090002120005)
  • 相关项目:下一代信息检索研究
中文摘要:

问答社区已经成为网络信息获取的一种重要渠道,但其信息质量差异较大。该文研究了问答社区中回答质量的评价方法。具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据。针对百度知道的特点,文本提出的基于时序的特征、基于问题粒度的特征和基于百度知道社区用户的特征,从更多的角度对回答质量进行评价。利用分类学习的框架,该文综合了新设计的三方面特征和经典的文本特征、链接特征,对高质量和非高质量的回答进行分类。基于大规模问答语料的实验表明,在文本特征与链接特征的基础上,基于时序与基于问题粒度的特征能够有效地提高回答质量的评估效果。另外也发现,根据该文的回答质量评价框架做出的质量评分能够有效地预测最佳答案。

英文摘要:

Community Question Answering(CQA) becomes more and more important for information access of Web users.However,CQA content quality varies dramatically from excellence to abuse and spam.This work investigates methods of answer quality analysis on CQA.In particular,it focuses on Baidu Knows,the largest Chinese CQA portal on the Web.A large scale corpus has been constructed by collecting data from the portal,and three new kinds of features were proposed,including sequence-based feature,features in the granularity of question,and BaiduKnows-specific user-based features.To separate high-quality answers from others,a learning based classification method is used to combine the proposed features and traditional textual and link-based features.Experiment results show that the proposed features are effective in improving the performance.Besides,this answer quality analysis framework achieves high accuracy in predicting best answers.

同期刊论文项目
期刊论文 117 会议论文 76 专利 12 著作 3
期刊论文 49 会议论文 19 获奖 1 著作 1
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136