位置:立项数据库 > 立项详情页
隐喻识别与理解的理论与方法研究
  • 项目名称:隐喻识别与理解的理论与方法研究
  • 项目类别:面上项目
  • 批准号:61170163
  • 申请代码:F020601
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2015-12-31
  • 项目负责人:王治敏
  • 依托单位:北京语言大学
  • 批准年度:2011
中文摘要:

在长期进行歧义消解研究之后,自然语言处理要向自然语言理解方向前进,必须攻克隐喻这个堡垒。隐喻的识别与理解是计算语言学更上一层楼的新的开拓性研究课题,关系到机器翻译、信息检索、问答系统等诸多应用系统的质量和成败。本项目以高质量机器翻译和自然语言理解为目标,探索汉语隐喻识别与理解的理论、方法及实现技术。主要内容有⑴在对汉语隐喻类型全面考察和计量分析的基础上,总结和发现隐喻的映射规律,建立以源域为核心的隐喻知识架构体系。⑵利用已有的《现代汉语语法信息词典》和《中文概念词典》等基础资源,采用主动学习方法从大规模语料中获取隐喻资源,建造面向机器理解和对外汉语教学的汉语隐喻知识库和标注语料库。⑶优化基于机器学习方法的隐喻识别模型,提高识别效率。(4)开展相似度推理的隐喻理解研究,实现大规模文本的源域、目标域、喻底的自动获取。本项研究将有助于解决隐喻对中文信息处理诸多环节的困扰,为相关应用提供支持。

结论摘要:

隐喻的识别与理解是计算语言学更上一层楼的新的开拓性研究课题,其关系到机器翻译、信息检索、问答系统等诸多应用系统的质量和成败。隐喻大量地存在于我们的语言生活中,Lakoff&Johnson(1980)指出隐喻不仅仅是语言的修辞手段,而且是人的一种思维方式。如果隐喻的识别和理解不能很好解决,将成为未来自然语言处理技术发展的瓶颈。本课题充分吸收国内外隐喻识别研究的成果,以高质量机器翻译和自然语言理解为目标,探索汉语隐喻识别与理解的理论、方法及实现技术。在隐喻识别、隐喻知识资源建设方面进行了多个角度的探索,包括基于词语相关度、词语抽象度的隐喻识别研究,隐喻识别与词义消歧的比较研究,以及基于聚类的词语字面义与隐喻义的区分研究等。主要内容包括⑴在对汉语隐喻类型全面考察和计量分析的基础上,总结和发现明喻和隐喻的映射规律,建立以源域为核心的隐喻知识架构体系。⑵利用已有的《现代汉语语法信息词典》和《中文概念词典》等基础资源,建造面向机器理解和对外汉语教学的多语种隐喻知识库,目前已经加工了汉语到英语、汉语到意大利语、汉语到波斯语的名词短语隐喻知识库,指导3位研究生撰写了和隐喻相关的论文。⑶优化基于机器学习方法的隐喻识别模型,本项目重点探索了名词、动词隐喻的识别与理解技术,比如基于SVM模型的隐喻识别理解研究 (4)开展面向名词短语隐喻识别的词语相关度计算, 面向隐喻识别的词语抽象性度量计算,词语相似度推理及词语聚类方法、动词语义选择限制等相关研究,并取得了多语种隐喻知识资源及识别理解技术等多项创新成果。本项目的相关结果表明,进一步研究中文信息中的隐喻识别与理解问题,实现对大规模文本的隐喻知识资源的提取,是一个具有极大理论和应用价值的长期课题,本项研究将有助于解决隐喻对中文信息处理诸多环节的困扰,为相关应用提供支持。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 19
  • 15
  • 0
  • 0
  • 0
相关项目
期刊论文 2 会议论文 10
期刊论文 48 会议论文 8 著作 2
期刊论文 16 会议论文 13 获奖 2
王治敏的项目