位置:成果数据库 > 期刊 > 期刊详情页
社区问答中基于机器翻译的问题检索模型的研究
  • ISSN号:1003-4978
  • 期刊名称:《河南大学学报:自然科学版》
  • 时间:0
  • 分类:TP391.3[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]河南大学软件学院,河南开封475001, [2]河南大学计算机与信息工程学院,河南开封475004
  • 相关基金:国家自然科学基金(61402150)
中文摘要:

在大规模的Yahoo数据和百度数据上利用问题本身、问题描述、最佳答案,以及其他答案构建了7种不同的翻译模型,并且在两个人工标注数据集上对比了这些模型在问题检索上的表现,研究利用机器翻译的技术在社区问答网站上进行问题检索.实验结果显示,这些模型都可以提升传统语言模型在问题检索上的效果,但在Yahoo数据和百度数据上,模型的表现并不相同.在平均答案数较多的Yahoo数据上,利用问题、问题描述和所有答案串联建立的模型表现最好,而在百度数据上,只用问题和问题描述就可以达到最好的效果.

英文摘要:

The paper studies the problem of leveraging the techniques of machine translation for question retrieval in community question answering (CQA) sites. The paper leverages questions, question descriptions, best answers, and other answers from large scale Yahoo data and Baidu data and trains 7 variants of translation based retrieval models. We compare different models on two manually labeled data sets. The experimental results reveal that all the translation based models can improve the traditional language model for information retrieval on question retrieval. Moreover, the performances of different models are not consistent on Yahoo data and Baidu data. On Yahoo data, in which there are more answers per question, translation model trained with questions, descriptions and concatenation of all answers has the best performance, while, on Baidu data, the best performing model is learned with only questions and their descriptions.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《河南大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:河南省教育厅
  • 主办单位:河南大学
  • 主编:乔家君
  • 地址:河南省开封市明伦街85号
  • 邮编:475001
  • 邮箱:xbzrb@henu.edu.cn
  • 电话:0378-2860394
  • 国际标准刊号:ISSN:1003-4978
  • 国内统一刊号:ISSN:41-1100/N
  • 邮发代号:36-27
  • 获奖情况:
  • 河南省优秀科技期刊一等奖,河南省高校优秀自然科学学报,全国学术期刊规范执行优秀奖
  • 国内外数据库收录:
  • 美国化学文摘(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版)
  • 被引量:5635