位置:立项数据库 > 立项详情页
基于语义范畴扩展的汉语词义消歧方法研究
  • 项目名称:基于语义范畴扩展的汉语词义消歧方法研究
  • 项目类别:青年科学基金项目
  • 批准号:60603092
  • 申请代码:F020603
  • 项目来源:国家自然科学基金
  • 研究期限:2007-01-01-2009-12-31
  • 项目负责人:卢志茂
  • 负责人职称:教授
  • 依托单位:哈尔滨工程大学
  • 批准年度:2006
中文摘要:

? 词义消歧是自然语言处理领域的基础研究问题,目前在研究上主要采用语料库结合统计学习的方法。因为训练数据的不充分造成的数据稀疏问题给研究者造成长期的困扰,如何攻克这个顽疾成为影响统计词义消歧进展的难题。 本项目针对训练语料规模过小导致的数据稀疏问题,提出语义范畴扩展思想。根据该思想对歧义词上下文中的指示词进行扩展,对歧义词的词义信息进行扩展,对歧义词的训练实例进行扩展,从而提高对现有资源的使用效率和质量,最大限度地为词义判断提供更多的信息和知识,改善语言模型的学习效果,增强模型的词义辨识能力,提高词义消歧的精度。 语义范畴扩展思想兼具有指导学习和无指导学习两种风格。通过语义范畴的扩展,充分发挥有限语言资源的作用,深度挖掘有限资源的信息和知识,为最大限度的提高模型训练能力提供帮助。深入探讨语义范畴扩展的思想和应用为词义消歧的研究发展提供了一个新的解决思路。

结论摘要:

英文主题词Word sense disambiguation, Natural language processing, Word-sense category extending, Statistical learning, Artifical intelligence


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 31
  • 15
  • 1
  • 0
  • 0
期刊论文
相关项目
期刊论文 10 会议论文 12 获奖 4
期刊论文 10 会议论文 4 获奖 18 著作 2
期刊论文 84 会议论文 21 获奖 1 著作 2
期刊论文 61 会议论文 57 获奖 1 著作 1
期刊论文 104
卢志茂的项目
期刊论文 44 会议论文 12