在自然语言处理领域中,语义角色标注已经成为继词法分析、语法分析、词义消歧之后的新的研究热点,其任务是标注出句子中谓词的语义角色。本项目针对汉语语义角色标注所面临的关键问题,从语料库的构建,标注方法的研究,实际应用等方面,进行深入细致的研究。主要的工作为构建了一套基于多种句法分析的汉语语义角色标注语料库,为后续研究工作打下基础;实现了基于依存句法分析的汉语语义角色标注系统,并提供在线服务(http://ir.hit.edu.cn/demo/ltp);融合了短语结构和依存句法分析的语义角色标注系统,进一步提高了语义角色标注系统的性能;提出了基于句法驱动的卷积树核的语义角色标注方法,一定程度上克服了数据稀疏问题;利用了HowNet对词义的描述增强语义角色标注系统性能;探索了语义分析与句法分析的联合学习机制,为进一步研究多任务联合学习奠定了基础;参加了CoNLL2008、2009句法分析和语义角色标注联合评测,并分别取得了第二名和第一名的成绩;在问答系统中应用了语义角色标注并取得了良好的效果;今后,我们将以语义角色标注为基础,进一步研究深层语义分析,如语义依存等。
英文主题词semantic role labeling; dependency parsing; convolution tree kernel; HowNet; CoNLL;