智能语音处理技术在新一代汽车中的应用日趋重要与广泛,用声音操控汽车或车载设备是新一代汽车舒适性和安全性的双重需要,但汽车中支持智能语音处理的计算平台是一个分布式的嵌入式计算系统,基于桌面计算平台的语音处理技术不能适应其要求,且在汽车行驶的实际噪声环境下智能语音系统性能变得极不稳定,语音识别率不高。本项目主要针对汽车平台和车载环境的语音信号预处理和自动语音识别展开研究,从语音端点检测、语音可懂度增强和语音特征提取等三方面出发,寻找突破解决上述问题的新技术与新方法,研究汽车中的典型噪声环境,建立国内首个汽车用汉语语音库,并最终实现一个中等以上词汇量、基于汽车平台和车载环境的、高鲁棒性、高识别率、满足实时性要求的嵌入式自动语音识别前端系统,为相关技术在汽车产业中的应用与推广提供支持。
Embedded System;Speech Processing;Automatic Speech Recognition;;
智能语音处理技术在我国新一代汽车电子产业中发挥着重要的作用,由于汽车环境噪音复杂多变,及车载嵌入式系统计算资源、存储资源的限制,适用于汽车平台下的语音前端处理技术的研究值得重视。本项目对车载嵌入式系统下的语音端点检测方法、语音可懂度增强方法、语音特征提取方法展开研究。首先,构建了车用汉语语音库、语音识别实验系统和基准实验算法;从多特征结合和非线性特征两方面深入探索,提出了适用于车载嵌入式环境下的语音端点检测方法;在考虑时间复杂度约束条件和车载多重语音隐蔽效应现象的前提下,提出了适用的语音增强方法;提出在汽车非平稳噪声环境下保持良好鲁棒性的特征提取方法;在构建的汽车嵌入式自动语音识别系统进行集成测试,所提新算法均有良好的性能表现,让自动语音识别系统更稳定、更精度。