基于多音箱回放的3D音频技术快速发展,MPEG开始制订3D音频标准,3D音频技术已成为新的热点。相较于传统环绕声,3D音频的关键就是其对三维空间方位感的重现,因此空间信息编码是3D音频编码系统的核心。研究显示人耳对不同方位、频率的空间信息感知阈值相差可达40倍,因此基于感知的3D音频空间信息编码成为3D音频高性能编码的关键。本项目针对现有多声道编码技术缺少对声音空间信息感知特性的考虑,在追求压缩率时空间信息感知失真过大的问题,在已有空间听觉实验的基础上,将传统感知熵理论拓展到空间可感知信息量的计算,建立可感知空间信息度量模型,给出基于感知的空间信息失真测度,完成基于感知的空间信息量化器设计,研究感知失真条件下空间信息比特分配算法,最终构建基于感知的空间信息编码框架,预期可进一步改善现有3D音频编码器主观性能,研究成果渴望成为相关标准的支撑技术,为解决当前3D音频编码的性能瓶颈提供技术支撑。
英文主题词Three-dimensional audio coding;perceptual distortion measure;spatial parameters;;;