位置:立项数据库 > 立项详情页
基于频率弯折小波和DZCPA特征的抗噪语音识别
  • 项目名称:基于频率弯折小波和DZCPA特征的抗噪语音识别
  • 项目类别:面上项目
  • 批准号:60472094
  • 申请代码:F010302
  • 项目来源:国家自然科学基金
  • 研究期限:2005-01-01-2007-12-31
  • 项目负责人:张雪英
  • 负责人职称:教授
  • 依托单位:太原理工大学
  • 批准年度:2004
中文摘要:

语音识别系统的抗噪能力一直是制约语音识别实用化的难题,但人耳却有很强的抑制噪声的能力,所以提取符合人耳听觉特性的特征有利于改善识别系统的抗噪性能,具有重要意义。弯折小波克服了普通小波倍频程划分频带的不足,更符合人耳听觉的特性,而ZCPA特征又具有抗噪的特点。本项研究在前期的ZCPA特征下,增加信号的差分过零信息,形成新的DZCPA特征;同时研究基于Laguerre序列展开式的频率弯折小波在抗噪识别

结论摘要:

语音识别系统的抗噪能力是系统实用化的关键,本项目主要研究符合人耳听觉特性的抗噪语音识别算法,所做主要工作包括①在保留原有信号过零信息的情况下,增加信号的差分过零信息,并进行加权处理,形成新的ZCPA特征,结果使识别率比原ZCPA平均高4.88个百分点。②研究了能直接将线性频率映射到Bark坐标的频率弯折Bark小波,并将其作为听觉滤波器组,代替原来的FIR滤波器,识别结果比原ZCPA平均高2.74个百分点。③研究了基于Laguerre序列展开式的频率弯折滤波器,建立了参数的确定方法,并将其作为听觉滤波器组,用于语音识别系统,识别结果比原ZCPA平均高6.7个百分点。④研究了观察窗长分别取C=10,15,20时对识别结果的影响,从而得到最优帧长C=15。C=15时的识别结果平均比原ZCPA高5个百分点,加权ZCPA结果平均比原ZCPA高6.5个百分点。⑤研究了模糊神经网络FNN用于语音识别系统的初步结果,即使用FNN代替原系统的HMM或RBF网络,结果表明,使用FNN比使用RBF的结果平均高7.8个百分点。本项目的研究成果对语音识别系统的实用化具有重要意义。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 35
  • 9
  • 0
  • 0
  • 1
期刊论文
相关项目
期刊论文 23 会议论文 3 获奖 1 专利 3
期刊论文 17 会议论文 10 著作 1
张雪英的项目
期刊论文 47 会议论文 3 获奖 1 专利 1