位置:立项数据库 > 立项详情页
汉语词汇关联知识的计算融合和分析应用研究
  • 项目名称:汉语词汇关联知识的计算融合和分析应用研究
  • 项目类别:面上项目
  • 批准号:60873173
  • 申请代码:F020601
  • 项目来源:国家自然科学基金
  • 研究期限:2009-01-01-2011-12-31
  • 项目负责人:周强
  • 负责人职称:研究员
  • 依托单位:清华大学
  • 批准年度:2008
中文摘要:

词汇关联知识涉及自然语言实词之间的各种句法语义联系,具有重要研究价值和应用潜力。本项目在汉语词汇关联知识的计算融合与获取应用方面,进行了以下探索 1) 融合从现有语言资源中提取的不同句法语义关联对,构建完成了包含10万词语概念节点和约150万关联边的汉语词汇概念网络,并在此基础上,开发完成汉语词语关联度计算工具,初步形成了汉语词语关联度的分析计算平台; 2) 从汉语句法树库TCT中自动提取形成一个事件句式标注库,覆盖21,051个事件目标动词的162,105个事件句式标注实例,可以作为汉语事件分析的训练和测试库; 3) 探索了基于浅层句法分析的汉语词汇关联对自动获取方法,在大规模语料文本上累计获取了约250万个比较可靠的汉语实词关联对,通过人工抽样分析和质量控制,形成了一个较好的词汇关联对计算资源; 4) 开发了高效的汉语事件句式抽取工具和移进-归约分析器,充分利用自动获取的词汇关联对信息作为外部资源特征进行句法排歧,达到了较好的分析性能提升效果。以上研究工作初步实现了汉语词汇关联知识的计算融合、自动获取和分析应用的完整解决方案,为进一步进行汉语真实文本内容的深入理解研究打下了基础

结论摘要:

英文主题词Lexical Concept Network; Event Annotation Bank; Event Extractor; Lexical Relation Pair Acquisition; Syntactic Disambiguation


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 3
  • 8
  • 0
  • 0
  • 0
周强的项目
期刊论文 2 会议论文 10