隐喻识别与理解的理论与方法研究-东篱科研大数据发现系统（DRDS）

位置：立项数据库 > 立项详情页

隐喻识别与理解的理论与方法研究

项目名称：隐喻识别与理解的理论与方法研究
项目类别：面上项目
批准号：61170163
申请代码：F020601
项目来源：国家自然科学基金
研究期限：2012-01-01-2015-12-31

项目负责人：王治敏
依托单位：北京语言大学
批准年度：2011

中文摘要：

在长期进行歧义消解研究之后，自然语言处理要向自然语言理解方向前进，必须攻克隐喻这个堡垒。隐喻的识别与理解是计算语言学更上一层楼的新的开拓性研究课题，关系到机器翻译、信息检索、问答系统等诸多应用系统的质量和成败。本项目以高质量机器翻译和自然语言理解为目标，探索汉语隐喻识别与理解的理论、方法及实现技术。主要内容有⑴在对汉语隐喻类型全面考察和计量分析的基础上，总结和发现隐喻的映射规律，建立以源域为核心的隐喻知识架构体系。⑵利用已有的《现代汉语语法信息词典》和《中文概念词典》等基础资源，采用主动学习方法从大规模语料中获取隐喻资源，建造面向机器理解和对外汉语教学的汉语隐喻知识库和标注语料库。⑶优化基于机器学习方法的隐喻识别模型，提高识别效率。(4)开展相似度推理的隐喻理解研究，实现大规模文本的源域、目标域、喻底的自动获取。本项研究将有助于解决隐喻对中文信息处理诸多环节的困扰，为相关应用提供支持。

中文主题词：隐喻识别；特征选择；知识获取；隐喻知识库；隐喻映射

英文摘要：

Metaphor recognition；Feature selection；Knowledge acquisition；Metaphor knowledge base；Metaphorical mapping

英文主题词： Metaphor recognition；Feature selection；Knowledge acquisition；Metaphor knowledge base；Metaphorical mapping

结论摘要：

隐喻的识别与理解是计算语言学更上一层楼的新的开拓性研究课题，其关系到机器翻译、信息检索、问答系统等诸多应用系统的质量和成败。隐喻大量地存在于我们的语言生活中，Lakoff&Johnson(1980)指出隐喻不仅仅是语言的修辞手段，而且是人的一种思维方式。如果隐喻的识别和理解不能很好解决，将成为未来自然语言处理技术发展的瓶颈。本课题充分吸收国内外隐喻识别研究的成果，以高质量机器翻译和自然语言理解为目标，探索汉语隐喻识别与理解的理论、方法及实现技术。在隐喻识别、隐喻知识资源建设方面进行了多个角度的探索，包括基于词语相关度、词语抽象度的隐喻识别研究，隐喻识别与词义消歧的比较研究，以及基于聚类的词语字面义与隐喻义的区分研究等。主要内容包括⑴在对汉语隐喻类型全面考察和计量分析的基础上，总结和发现明喻和隐喻的映射规律，建立以源域为核心的隐喻知识架构体系。⑵利用已有的《现代汉语语法信息词典》和《中文概念词典》等基础资源，建造面向机器理解和对外汉语教学的多语种隐喻知识库，目前已经加工了汉语到英语、汉语到意大利语、汉语到波斯语的名词短语隐喻知识库，指导3位研究生撰写了和隐喻相关的论文。⑶优化基于机器学习方法的隐喻识别模型，本项目重点探索了名词、动词隐喻的识别与理解技术,比如基于SVM模型的隐喻识别理解研究 (4)开展面向名词短语隐喻识别的词语相关度计算, 面向隐喻识别的词语抽象性度量计算,词语相似度推理及词语聚类方法、动词语义选择限制等相关研究，并取得了多语种隐喻知识资源及识别理解技术等多项创新成果。本项目的相关结果表明，进一步研究中文信息中的隐喻识别与理解问题，实现对大规模文本的隐喻知识资源的提取，是一个具有极大理论和应用价值的长期课题，本项研究将有助于解决隐喻对中文信息处理诸多环节的困扰，为相关应用提供支持。

成果综合统计