3D影视的兴起使三维音视频技术成为信息与通信行业的技术前沿和研究热点。三维音频系统声道数多、数据量大。通过简化系统和压缩数据来降低三维音频系统的声道数和数据量,是三维音频系统亟待解决的重要问题。双耳线索是三维声场中人耳对声源水平方位定位的重要依据,但是人耳对不同方位声源的双耳线索的感知敏感度具有较大的差异性。本项目针对双耳线索的感知敏感度特性,在水平面多个方位测量双耳线索的感知阈值;通过数学插值建立基于空间分布和频率特性的双耳线索感知阈值曲面,将传统的双耳线索感知阈值研究由定性描述拓展到定量分析;将该曲面模型应用于水平多声道信号的高效编码,提出基于感知阈值的多声道信号空间参数感知无失真量化方法。在传统单声道编码码率条件下,增加8kbps空间参数信息可获得优质的立体声重建信号。与现有参数立体声编码器相比,重建音质提升10个MUSHRA得分。研究成果对于三维音频信号的高效表达具有指导意义。
英文主题词source localization;Binaural Cues;Just Noticeable Difference;Psychophysics;Spatial Audio Coding