位置:成果数据库 > 期刊 > 期刊详情页
一种新的层次化结构问题分类器
  • ISSN号:1003-0077
  • 期刊名称:中文信息学报
  • 时间:0
  • 页码:92-97
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]清华大学计算机科学技术系智能技术与系统国家重点实验室,北京100084
  • 相关基金:国家自然科学基金资助项目(60572084);863国家高技术研究发展计划资助项目(2006AA022321)
  • 相关项目:面向生物学文献的本体自动提取算法研究
中文摘要:

问题分类是自动问答系统中关键技术之一,而问题中的关键词语是问题分类的重要依据。本文主要探讨问题词和中心词在问题分类中所起的作用,提出一种基于问题词和中心词的层次化结构问题分类器。分类器首先利用问题词将句子集分为三类,然后对于每个类别分别建立相应的分类器,对于what型问题,本文构造了基于关联规则的中心词分类器。本文实现的层次化结构分类器在TREC2007QA问题集和UIUC数据集上精度分别达到了90.6%和84.0%,充分显示了问题词和中心词在问题分类中至关重要的作用。

英文摘要:

Question classification is one of the most crucial models in question answering system. And the key words play very important roles for question classification task. In this paper, we investigate the role of question word and head word in question classification. This paper proposed a novel hierarchical structure question classifier based on the question words and head words. Using question words, it first simple classified the question sentence into three categories. For each category, we designed an appropriate classifier respectively. As to the type of what questions, we constructed a head word based classifier using assassination rules. The novel hierarchical structure question clas- sifier is tested on the TREC2007 QA question set and the UIUC Dataset. It can get accuracy of 90.60/00, 84.0% respectively, which proved the importance of the question words and head words in the question classification.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136