位置:立项数据库 > 立项详情页
汉语依存句法分析若干关键技术研究
  • 项目名称:汉语依存句法分析若干关键技术研究
  • 项目类别:青年科学基金项目
  • 批准号:60803093
  • 申请代码:F020602
  • 项目来源:国家自然科学基金
  • 研究期限:2009-01-01-2011-12-31
  • 项目负责人:车万翔
  • 负责人职称:副教授
  • 依托单位:哈尔滨工业大学
  • 批准年度:2008
中文摘要:

句法分析是自然语言处理的核心问题,对信息抽取、机器翻译等应用有重要的支撑作用。依存语法以其形式简洁、易于标注、便于应用等优点,逐渐受到重视。虽然目前汉语依存句法分析研究取得了一定的进展,但是其准确率和效率仍然不能满足实际应用的需要。本项目针对汉语的特点以及汉语句法分析的难点,面向实际应用,从下5个方面对汉语依存句法分析技术进行了研究1、对比了基于转移和图的模型在汉语上的性能;2、提出了基于柱搜索的高阶依存分析模型,并参加了CoNLL2009依存句法和语义分析联合评测,取得了第一名的成绩;3、探索了基于图和基于转移的融合模型,进一步提升了句法分析的准确率;4、提出了基于片段的两阶段汉语依存分析方法,大幅度提高了汉语句法分析效率;5、词性标注与句法分析的联合学习模型,一定程度上克服了汉语词性标注准确率低对句法分析的影响。项目负责人所在团队因其开发的"语言技术平台(LTP)"获钱伟长中文信息处理科学技术奖一等奖,其中汉语依存句法分析是该平台的核心系统,项目负责人本人也因此获汉王青年创新奖一等奖。

结论摘要:

英文主题词dependency parsing; beam-search; CoNLL;


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 22
  • 14
  • 0
  • 0
  • 2
相关项目
期刊论文 29 会议论文 12
车万翔的项目