如何有效的从随机背景噪声中准确提取语言信息是语音识别技术急需解决的关键问题。听觉系统有很好的抗噪声能力。最新研究表明,听觉系统对时序信号的传输与处理有抗噪声,甚至利用噪声增强信号的能力,该能力来自至今未被运用的听觉系统独特的时序信号非线性处理机制。本研究将通过生理实验和物理模型,研究内毛细胞、听神经、具有不同自发发放率听神经阵列、耳蜗核的非线性信号处理机制,建立反映这些机制的非线性点序列信号处理模型,并在此基础上构筑运用这些时序信号非线性处理机制的抗噪声语音信号处理方法。该研究将成为语音识别技术的重大突破口,有效解决语音识别技术中的噪声问题,开创运用神经点序列信号处理方式的崭新信号处理模式,为相关声信号(如水声信号)处理中噪声问题的解决、高灵敏度微型声传感器的设计提供借鉴。对听觉时序信号处理机制的研究,将增进对听觉信号处理与编码机制的认知,具有重要的科学意义。
在语音信号处理中,一个重要的问题是如何使系统在噪声的环境中仍然保持有良好的语音信号处理性能。由于人的听觉系统有卓越的抗噪声能力,模仿人的听觉信号处理功能成为解决这一问题的重要方向。这方面已有许多研究和尝试,但是效果并不如意。事实上,尽管人们试图模仿听觉系统的信号处理方式,却并不知道到底是听觉的哪些信号处理特征使其有抗噪声的功能,以至很多基于听觉机制的信号处理只是流于形式,并没有抓住实质,也无实质性的抗噪声性能。在我们前期基础理论研究突破的基础上,本研究将重点放在听觉系统非线信号处理特征上。通过理论与实验研究,揭示了在听觉信号的非线性滤波、非线性力/电转换、听觉信息的神经非线性的离散发放序列表达,以及神经阵列表达与整合中存在的抗噪声信号处理机制。并在此基础上建立了能反映这些新发掘非线性抗噪声特征的语音前端信号处理方式。这一研究不仅促进了对听觉信号处理机制的认识,为抗噪声语音信号处理提供了新方法,在其他相关信号的抗噪声处理中也有重要的借鉴和应用。