新闻事件语义抽取是信息抽取研究中的热点问题之一,是大规模实时新闻数据管理研究中的关键一环。本课题针对传统新闻事件抽取工作对于人工标注数据的依赖问题提出建立一种针对新闻事件语义要素的自动分析模型,并尝试借助概率统计方法将多媒体语义信息融入到新闻语义要素中。贯穿本课题的一个中心思想是如何减少人工参与,更多地利用新闻资源庞大的数据规模来挖掘新闻事件的叙事模式,进而抽取核心事件的语义要素。本课题的主要研究内容包含以下四个方面基于叙事模式的新闻事件分析研究、基于事件语义链的核心新闻事件识别研究、无监督新闻事件语义要素抽取研究以及针对多媒体新闻语义要素融合的研究。本项目通过对新闻进行事件语义层次上的重构实现对实时新闻数据的自动事件语义要素抽取,为自动构建知识库、基于事件的信息检索等高级应用打下坚实基础。
英文主题词Information Extraction;News Event Extraction;Narrative Schema;Entity Relation Extraction;