公共安全突发事件频发使我国对安防监控需求日益迫切,音频监控不受角度、光照及遮挡限制,是不可或缺的关键支撑技术。监控网络带宽波动频繁,严重影响监控音频质量。可分级音频编码是带宽波动情况下提升音质的最有效手段,但当前基于能量、信掩比等人耳感知特性的可分级音频编码,与安防监控关注音频能量、方位快速变化等特征不吻合,导致分级增强层被抛弃时关注音频信号质量下降。针对此问题,本课题研究基于心理选择性关注机制的可分级音频编码方法,提升安防监控关注音频质量1针对传统关注度模型无法表达音源方位快变的问题,引入空间线索变化度量音源方位快变关注度,建立安防监控音频关注度模型;2依据关注失真更易察觉的原理,研究基于关注度失真的带宽可分级编码方法,和基于关注度优先级的信噪比可分级编码方法。本研究对探索基于心理因素的高效音频压缩编码算法具有重要研究价值,对提高安防监控主观音质,促进音频监控技术进步具有重要意义。
英文主题词Surveillance;Audio Coding;Attention Model;Spatial Cues;Scalable