依存句法分析是自然语言处理的一个核心研究问题。已有研究主要基于单语文本,即输入单语句子,输出对应的依存树。由于大规模双语对齐文本的出现和依存句法驱动的统计机器翻译的应用需求,最近几年双语依存句法分析日益受到重视。本项目重点研究基于汉英双语对齐文本的依存句法分析,即汉英双语依存句法分析。主要研究内容包括1)研究有指导的双语依存句法分析模型定义、解码算法和特征表示;2)研究基于大规模语料的特征表示和特征的领域自适应问题;3)探索双语依存句法分析和统计机器翻译的交互学习机制;4)集成上述研究成果,构造一个统一的基于图模型的汉英双语依存句法分析平台。当前汉英双语依存句法分析研究还处于起步阶段,本项目的开展将为汉语句法分析技术和机器翻译研究作出重要贡献,具有重要的研究价值和应用价值。
英文主题词Dependency Parsing;Feature Representation;Syntax Parsing;Semi-supervised Learning;Multilingual Analysis