位置:立项数据库 > 立项详情页
面向信息处理的词义区分理论与计算模型研究
  • 项目名称:面向信息处理的词义区分理论与计算模型研究
  • 项目类别:面上项目
  • 批准号:60775031
  • 申请代码:F0305
  • 项目来源:国家自然科学基金
  • 研究期限:2008-01-01-2008-12-31
  • 项目负责人:刘扬
  • 负责人职称:讲师
  • 依托单位:北京大学
  • 批准年度:2007
中文摘要:

语义分析涵盖词、短语、小句、句、句群、段落、篇章等不同层次,现有研究受限于词义层且其理论基础极为薄弱。申请人期望在词义区分、词义知识表示与获取(资源建设)、词义消歧的整体方案下有效化解这一难题与困境。本项目的研究依据"使用即意义"原则和"经验主义"方法,提出新的词义区分理论,将词义区分视为目标词的搭配环境的聚类问题;提出新的"高层概念树+词义多元组"的词义知识表示框架,高层概念树表达粗粒度词义的聚合关系,词义多元组以词义区分为基础、表达任一词义的组合关系;提出新的词义消歧模型,即,与聚合关系相关的段落-篇章层消歧结合与组合关系相关的句子层消歧,增强消歧的理据性和计算性。上述理论与模型作为原始创新思路,建立在坚实的计算语言学(搭配是最简单、最易抽取的语言成分)、应用数学(聚类方法趋于成熟)基础上,建立同源知识做一体化处理,可行性强,有助于促进词义问题的规范化与标准化。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 6
  • 4
  • 0
  • 0
  • 0
相关项目
期刊论文 31 会议论文 15 专利 1
期刊论文 11 会议论文 1
刘扬的项目