位置:成果数据库 > 期刊 > 期刊详情页
基于文本蕴含的选择类问题解答技术研究
  • ISSN号:0479-8023
  • 期刊名称:《北京大学学报:自然科学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:国家自然科学基金(61173073); 863计划(2015AA015405)资助
中文摘要:

利用选择类问题具有明确候选项的特点,简化问题分类过程,并针对长文本语义蕴含短文本语义的语言现象,提出一种根据文本蕴含强度大小对候选答案进行排序的方法。在没有大规模问答对的情况下,采用维基百科中文语料库,以全国各省市高考地理选择题作为实验数据,通过句子相似度和文本蕴含两种方法来解答地理选择题。实验表明,基于文本蕴含方法的准确率为36.93%,比基于词嵌入的句子相似度方法提高2.44%,比基于向量空间模型的句子相似度方法提高7.66%,验证了该文本蕴含强度计算方法的有效性。

英文摘要:

This paper proposes a method to compute textual entailment strength, taking multiple-choice questions which have clear candidate answers as research objects, aiming at the phenomenon of long text entailing short text. Two methods are used to answer the college entrance examination geography multiple-choice questions based on the Wikipedia Chinese Corpus in the absence of large-scale questions and answers. One is based on the sentence similarity and the other is based on the textual entailment proposed above. The accuracy rate of the proposed method is 36.93%, increasing by 2.44% than the way based on the word embedding sentence similarity, increasing 7.66% than the way based on the Vector Space Model sentence similarity, which confirm the effectiveness of the method based on the textual entailment.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:北京大学
  • 主编:赵光达
  • 地址:北京海淀区海淀路52号
  • 邮编:100871
  • 邮箱:xbna@pku.edu.cn
  • 电话:010-62756706
  • 国际标准刊号:ISSN:0479-8023
  • 国内统一刊号:ISSN:11-2442/N
  • 邮发代号:2-89
  • 获奖情况:
  • 1997年第二届全国优秀科技期刊评比一等奖,1999年教育部“优秀自然科学学报一等奖”,1999年获首届国家期刊奖,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,英国科学文摘数据库,英国动物学记录,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:18270