位置:成果数据库 > 期刊 > 期刊详情页
一种面向社区型问句检索的主题翻译模型
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院社会计算与信息检索研究中心,哈尔滨150001
  • 相关基金:国家“九七三”重点基础研究发展规划项目基金(2014CB340503); 国家自然科学基金重点项目(61133012);国家自然科学基金面上项目(61472105)资助 致谢编辑及审稿老师给了宝贵意见,在此表示感谢!
中文摘要:

基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型.

英文摘要:

The ranking scheme of the statistical translation based question retrieval models is mainly depended on the translation probabilities between terms. However, the existing translation based models yield on the noise generated by the translation model and further impact the question retrieval results. In this paper, we proposed a topic inference based translation model for question retrieval. By leveraging the topic information, we theoretically verified that it can reasonably control the translation noise and then improves the question retrieval results. Experimental results show that the proposed model significantly outperforms the state-of-the-art question retrieval models in MAP (Mean Average Precision), MRR (Mean Reciprocal Rank) and p@1 (precision at position one).

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433