位置:立项数据库 > 立项详情页
基于Markov逻辑网络的限定领域中文自动问答系统研究
  • 项目名称:基于Markov逻辑网络的限定领域中文自动问答系统研究
  • 项目类别:青年科学基金项目
  • 批准号:61003091
  • 申请代码:F020511
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:邱锡鹏
  • 负责人职称:副教授
  • 依托单位:复旦大学
  • 批准年度:2010
中文摘要:

自动问答系统是人工智能和信息检索领域热点研究方向之一。它接受用户用自然语言提出的问题,然后返回该问题的答案。目前由于开放领域问答系统的研究主要针对单一的、孤立的、基于事实性的问题,并且答案准确率也比较低,对于复杂问题更是难以处理,因此陷入了一定瓶颈。相反在限定领域中,自动问答系统蕴含着巨大的应用价值。由于可以利用领域知识,限定领域自动问答系统可以处理一些复杂问题并提高答案准确率。本课题以限定领域中文自动问答系统作为研究目标,提出以Markov逻辑网络为基础构建领域知识库,并且利用Markov逻辑网络的逻辑和概率两重特征,很好地将信息抽取、知识库查询和答案生成多个环节有机的联系到一起来,并构成自动问答系统。本课题的研究可以极大地推动了相关技术(知识库表示、逻辑推理、信息抽取、句法分析和实体名识别等)的发展,并促进研究与应用的紧密结合。

结论摘要:

本项目按照既定的研究计划,顺利开展了研究,完成了预期目标,发表论文19篇,其中在ACL、EMNLP、COLING、ACM TALIP等国际期刊和会议上发表高质量论文8篇。该项目取得的重要成果总结如下(1)提出了基于Markov逻辑网络的限定领域自动问答系统的基本框架,将问答系统的各个环节(知识表示、问句分析、逻辑转换、语义推理、答案验证等)无缝地整合到一个统一的框架中,提高了问答系统的系统性,为深层问答系统奠定了基础。(2)提出了一套通过自然语言语理解技术从大规模限定领域数据中抽取专业知识的方法,并构建专业知识库,将自然语言问句转换为逻辑表示,通过Markov逻辑网络进行推理并给出答案。该方法有效地整合了各种资源,提高了答案的准确性。(3)深入研究了目前中文自然语言处理面临的问题,如中文分词、词性标注、实体名识别以及句法分析等,特别是针对问句的分析和处理,提出了多种有效的算法提高中文自然语言处理的性能和效率,并开发了一套开源的中文自然语言处理的工具FudanNLP。(4)构建了面向音乐和电信领域的问答原型系统,包含自然语言理解、知识表示、推理,问句分析、答案抽取、答案验证等模块。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 4
  • 15
  • 0
  • 0
  • 0
相关项目
期刊论文 15 会议论文 16
期刊论文 32 会议论文 13 获奖 1 专利 5 著作 1
期刊论文 10 会议论文 12 获奖 4
期刊论文 10 会议论文 4 获奖 18 著作 2
邱锡鹏的项目