项目开展三年来,课题组根据立项研究内容,认真开展研究工作,在如下几个问题上取得有效进展(1)针对音频编解码的应用研究需求,建立了低延迟多码率的音频编解码器,针对正交变换的音频信号,采用分类的格型矢量量化的方法进行正交变换后的频域信号的量化,提高了音频编解码器量化精度并降低码率,同时也搭建了可分层的编解码框架结构;(2)针对音频编解码中的相关问题语音增强算法性能的不确定性以及音频信号的分类问题进行研究,总结出语音增强算法性能不确定性的研究模型和一种实时的基于粗细分级的多规则音频信号分类方法;(3)结合当前的网络通信的实际情况,提出了多描述编解码的基本方案和码流结构;(4)同时开展音频编解码器的编码质量评估方法,除了没有网络丢包的音质评估,也开展了丢包条件下的音质评估问题,研究提出了用PESQ来评价丢帧算法主观效果的优劣,分析了不同丢帧率下PESQ测量值的统计特性。围绕本基金项目,课题组共发表论文或专利21篇,其中SCI索引论文2篇,申请专利6项,授权1项,达到了预期目标
英文主题词orthogonal transformation;perceptual model; audio encoding/decoding;speech/music classification