为了参与未来2kb/s国际语音编码标准的竞争,本课题在充分研究现有的波形内插语音编码方法基础上,研究基于闭环形式的波形内插语音编码方案,包括基于语音暂时分解技术的声道参数高效压缩算法,低延时、高准确和具有顽健性的音调检测方法,基于闭环合成分析方法的激励源提取与量化技术,用于闭环参数提取和语音增强的感知失真测度和基于人耳听觉特性的激励源相位模型,最终提交一种新的2kb/s语音编码方案,使语音质量达到通信质量,为2kb/s国际语音编码标准的提出提供具有理论价值和实际价值的前期性研究成果,满足多媒体通信、网络通信和移动通信对具有通信质量的低速率语音编码的需求。
本课题以波形内插(WI)语音编码模型为研究基础,应用各种信号处理方法和数学模型,针对编码器的各个模块,提出了多种新的算法,其中包括基于DCT分带谱熵与信号分解的高精度基音检测算法,一种基于差分编码的4~6bit基音量化算法,一种基于SVD的低复杂度特征波形(CW)分解方法及参数量化方法,CW相位谱分析合成矢量量化方法和三次多项式插值重建方法,应用FFT变换、三次B样条插值和周期延拓等技术的CW表达和对齐的快速算法,基于矢量变维(VD)和离散余弦变换(DCT)的CW幅度量化方案,一种LSF参数的预测式瞬时联合多级分裂矢量量化算法,并综合上述各种方法和技术,开发出了一套低复杂度、高质量的2kb/s的WI语音编码算法。语音质量测试表明DRT得分为96.2%,重建语音清晰度为优,MOS分达到了3.34,重建语音质量好于2.4kb/s MELP算法,接近于4.8kb/s CELP算法。本语音编码算法具有自主知识产权,可应用于无线移动通信、保密电话通信,卫星通信,VoIP通信和语音压缩存储等领域。