汉语特征结构的资源建设和自动分析研究-东篱科研大数据发现系统（DRDS）

位置：立项数据库 > 立项详情页

汉语特征结构的资源建设和自动分析研究

项目名称：汉语特征结构的资源建设和自动分析研究
项目类别：重大研究计划
批准号：90820005
申请代码：F020601
项目来源：国家自然科学基金
研究期限：2009-01-01-2011-12-31

项目负责人：姬东鸿
负责人职称：教授
依托单位：武汉大学
批准年度：2008

中文摘要：

本项目旨在研究面向语义的汉语特征结构，建立基于特征结构的短语级和句子级的语义资源并探讨基于判别模型的特征结构分析策略。特征结构是根据汉语自身特点而提出的一种语义描写机制，它是由实体、特征和特征值组成的三元组的集合。所建立的资源包含6万个复合名词短语和6万个句子的特征结构。对于特征结构的自动分析，我们把它转换为关联树的分析问题，并利用无向图的最大生成树的分析策略，同时设计丰富的特征空间，以刻划全局性的结构化信息，从而避免依靠局部上下文进行判断所引起的问题。本项目有助于探讨和阐清适合汉语实际的语义描写机制；丰富汉语自身的语义资源及探索有效的汉语语义分析策略。对提高汉语自动分析、信息抽取和问题解答等技术的性能具有一定的意义。我们分别在汽车领域舆情分析系统、电信领域客户反馈分析系统和安全领域敏感信息分析系统中应用特征结构的分析，并取得了较好的效果。

中文主题词：特征结构；特征；语义资源；判别模型；事件抽取

结论摘要：

英文主题词Feature structure, Semantic resource, Features, Discriminative model, Event extraction

成果综合统计