本项目基于语音、语言处理技术的最新进展,在已有研究成果的基础上,开展语音识别中若干关键问题的研究。主要包括1、在语音识别系统中充分利用词法、句法、语义等较高层次的语言学知识,集成多层语言学知识构建语言模型;2、在加权有限状态转换器(WFST)框架下,实现多层语言模型的合并与优化,使各层模型充分利用其它层模型提供的语言学信息,有效克服传统自然语言分层串行处理引起的错误累积;3、在语音识别解码阶段,利用WFST实现声学模型和语言模型的结合,从而给出性能优异的一个语音识别全局解码算法。本研究可为在语音识别中引入高层语言学知识以及融合声学模型和语言模型的高效全局解码算法,提出新的思路和方法。同时,为提高语音识别系统性能,以及推动高度自然、便捷的人机交互技术的发展做出积极贡献。