针对从某个频段信号估计其它频段信息这个典型问题,本项目以语音信号为研究对象,采用压缩感知、盲信号处理及信号重建等理论,研究语音信号带宽扩展新方法。主要包括研究变换域内的人工语音带宽扩展(BWE)新方法;在较好地估计和恢复某些特定频带独有参数的基础上,研究基于码流的广义语音带宽扩展方法;在有效进行头相关传递函数与单声道带宽扩展方法融合的基础上,研究双声道语音带宽扩展新方法;研究300Hz以下频带带宽扩展新方法。在分析、明确噪声对语音带宽扩展算法主要参数作用机理的基础上,进行参数选择优化和参数韧性估计的研究。以性能优良的新方法为基础,建立一个语音带宽扩展实时处理系统,并进行语音带宽扩展性能测试。项目研究成果将揭示压缩感知等共性理论在语音带宽扩展中的应用规律,完善语音信号处理理论。此外,研究成果在语音及音频编码、语音识别、语音消噪、3D音频、虚拟超重低音和无线广播等领域也具有显著的应用价值。
Speech bandwith extension;Sparse representation;Information hiding;Reverberation suppression;Head related transfer function
本项目对人工语音带宽扩展新方法研究进行了深入研究,主要成果有(1)提出了非参数模型的语音带宽扩展新技术路线;基于该路线,提出了基于稀疏表示与K-SVD的人工语音带宽扩展新方法,提出了基于经验模式分解(EMD)的人工语音带宽扩展新方法。(2)提出了广义语音带宽扩展的概念,即在语音编码器的码流域直接进行扩展带宽,进而提出广义语音带宽扩展新策略;针对两种典型语音编码器(G.729和AMR),提出了相应的广义语音带宽扩展新方法。(3)结合语音分层编码技术和信息隐藏技术,提出了盲语音带宽扩展新方法。(4)研究了基于G-P外推算法的语音带宽扩展方法和低频语音带宽扩展方法。(5)为增强语音带宽扩展方法的鲁棒性,克服房间混响和噪声的不利影响,研究了房间混响与瞬态噪声的抑制问题,包括提出了基于改进的最小控制递归平均和最优修正对数谱幅度估计的瞬态噪声抑制方法,提出了基于语音信号重建的瞬态噪声抑制方法,提出了谱减法和复倒谱域滤波的混响抑制方法,提出了谱减法和基于谱线增强的混响抑制方法。(6)研究了头相关传递函数(HRTF)的高效压缩和个性化方法。(7)建立了人工语音带宽扩展实时处理及演示系统。