近年来,自动语音识别技术取得了长足进展,但面向真实场景的语音转写技术仍然无法满足应用需求。当前出现了一批融合用户反馈的语音识别系统,但这些系统只利用用户反馈信息进行错误修正,高准确率的取得完全依赖于人的操作,无法实现高效的语音转写。针对这一问题,本项目拟研究面向高准确率语音转写的用户反馈学习与识别结果优化方法,研究可融合非确定性反馈的反馈后快速重新识别、基于反馈历史的词汇学习和重复性错误自动修正、基于修正文本的语言模型自适应等关键技术,实现一种利用用户反馈信息不断学习和提高的语音识别系统用户的每次修正反馈,都会影响当前句的识别结果,与用户修正的字相关联的错误可得到自动修正;同时,系统学习反馈涉及的词汇,调整内部模型,避免相似的错误再次发生。与当前已有的语音识别模型自适应方法相比,本项目研究的方法充分利用了用户反馈中包含的丰富信息,学习更有针对性,对识别性能的提升更为明显。
英文主题词speech recognition;user feedback;alternative list;automatic error correction;language model adaptation