语音识别系统的抗噪能力一直是制约语音识别实用化的难题,但人耳却有很强的抑制噪声的能力,所以提取符合人耳听觉特性的特征有利于改善识别系统的抗噪性能,具有重要意义。弯折小波克服了普通小波倍频程划分频带的不足,更符合人耳听觉的特性,而ZCPA特征又具有抗噪的特点。本项研究在前期的ZCPA特征下,增加信号的差分过零信息,形成新的DZCPA特征;同时研究基于Laguerre序列展开式的频率弯折小波在抗噪识别
语音识别系统的抗噪能力是系统实用化的关键,本项目主要研究符合人耳听觉特性的抗噪语音识别算法,所做主要工作包括①在保留原有信号过零信息的情况下,增加信号的差分过零信息,并进行加权处理,形成新的ZCPA特征,结果使识别率比原ZCPA平均高4.88个百分点。②研究了能直接将线性频率映射到Bark坐标的频率弯折Bark小波,并将其作为听觉滤波器组,代替原来的FIR滤波器,识别结果比原ZCPA平均高2.74个百分点。③研究了基于Laguerre序列展开式的频率弯折滤波器,建立了参数的确定方法,并将其作为听觉滤波器组,用于语音识别系统,识别结果比原ZCPA平均高6.7个百分点。④研究了观察窗长分别取C=10,15,20时对识别结果的影响,从而得到最优帧长C=15。C=15时的识别结果平均比原ZCPA高5个百分点,加权ZCPA结果平均比原ZCPA高6.5个百分点。⑤研究了模糊神经网络FNN用于语音识别系统的初步结果,即使用FNN代替原系统的HMM或RBF网络,结果表明,使用FNN比使用RBF的结果平均高7.8个百分点。本项目的研究成果对语音识别系统的实用化具有重要意义。