位置:立项数据库 > 立项详情页
具有通信质量的2 kb/s语音编码算法研究
  • 项目名称:具有通信质量的2 kb/s语音编码算法研究
  • 项目类别:面上项目
  • 批准号:60372063
  • 申请代码:F010204
  • 项目来源:国家自然科学基金
  • 研究期限:2004-01-01-2006-12-31
  • 项目负责人:鲍长春
  • 负责人职称:教授
  • 依托单位:北京工业大学
  • 批准年度:2003
中文摘要:

为了参与未来2kb/s国际语音编码标准的竞争,本课题在充分研究现有的波形内插语音编码方法基础上,研究基于闭环形式的波形内插语音编码方案,包括基于语音暂时分解技术的声道参数高效压缩算法,低延时、高准确和具有顽健性的音调检测方法,基于闭环合成分析方法的激励源提取与量化技术,用于闭环参数提取和语音增强的感知失真测度和基于人耳听觉特性的激励源相位模型,最终提交一种新的2kb/s语音编码方案,使语音质量达到通信质量,为2kb/s国际语音编码标准的提出提供具有理论价值和实际价值的前期性研究成果,满足多媒体通信、网络通信和移动通信对具有通信质量的低速率语音编码的需求。

结论摘要:

本课题以波形内插(WI)语音编码模型为研究基础,应用各种信号处理方法和数学模型,针对编码器的各个模块,提出了多种新的算法,其中包括基于DCT分带谱熵与信号分解的高精度基音检测算法,一种基于差分编码的4~6bit基音量化算法,一种基于SVD的低复杂度特征波形(CW)分解方法及参数量化方法,CW相位谱分析合成矢量量化方法和三次多项式插值重建方法,应用FFT变换、三次B样条插值和周期延拓等技术的CW表达和对齐的快速算法,基于矢量变维(VD)和离散余弦变换(DCT)的CW幅度量化方案,一种LSF参数的预测式瞬时联合多级分裂矢量量化算法,并综合上述各种方法和技术,开发出了一套低复杂度、高质量的2kb/s的WI语音编码算法。语音质量测试表明DRT得分为96.2%,重建语音清晰度为优,MOS分达到了3.34,重建语音质量好于2.4kb/s MELP算法,接近于4.8kb/s CELP算法。本语音编码算法具有自主知识产权,可应用于无线移动通信、保密电话通信,卫星通信,VoIP通信和语音压缩存储等领域。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 25
  • 16
  • 0
  • 0
  • 0
相关项目
鲍长春的项目