基于传统滤波器方法为基础的抗噪语音处理方法需要对噪声分布进行估计,要求噪声必需是平稳或准平稳条件下的,无法处理非平稳(例如人声背景)下的噪声问题。基于计算听觉场景分析的语音分离提供了一种解决途径,但目前的现有方法忽略了语音感知质量特性,并且效率也难于满足实用要求,而这种实现方案确实对非平稳噪声的处理提供了一种颇具潜力的解决途径。正是基于此出发点,在分析现有基于计算听觉场景分析语音分离工作优势与不足的基础上,本项研究提出以客观质量评估为指导线索、以计算听觉场景分析为基础的混合语音分离新方法,旨在获得传统方法所不能解决的与非平稳噪音混合时目标语音分离的有效处理手段,使抗噪语音处理提升到一个新高度。本项研究对于数字媒体领域的多媒体检索、声学目标检索、语音增强、鲁棒性语音识别等关键技术具有重要意义和学术价值,并在通信、金融、娱乐、服务、多媒体教学等多项领域应用前景广扩。
英文主题词Objective Quality Assessment of Speech; Computational Auditory Scene Analysis;Speech Separation;Speech Enhancement;Unstable Noise