数字音频信号处理技术的飞速发展和互联网的迅速普及使传统音频作品的数字化和网络出版成为必然,随之而来的是日益凸现的数字音频作品的侵权问题。本项目针对基于多目的水印算法的所有权认证和内容完整性验证模型所存在的音频感知质量难以保证、不同性质水印之间容易产生相互干扰、以及不具备抗MP3压缩能力等问题,提出基于感知Hash和脆弱水印的压缩域音频安全保护模型。该模型可在确保音频感知质量的前提下同时实现压缩域音频的所有权认证、内容完整性验证以及篡改定位。课题的创新环节包括1)基于线性预测系数主分量矢量量化的语音感知Hash算法;2)基于高频分量主分量分析和瞬时混合模型的脆弱水印算法;3)基于感知Hash和脆弱水印算法的音频安全保护模型;4)基于帧同步原理的抗MP3压缩算法。
Audio perceptual hashing;audio fragile watermarking;cochleagram;computer vision analysis;maximum likelihood estimation
数字音频信号处理技术的飞速发展和互联网的迅速普及使传统音频作品的数字化和网络出版成为必然,随之而来的是日益凸现的数字音频作品的侵权问题。针对这一难题,本项目提出基于感知Hash和脆弱水印的压缩域音频安全保护模型,所取得的主要研究成果包括1)基于自然语音信号短时平稳特性的鲁棒语音感知哈希算法;2)基于音频感知特征非负矩阵分解的音频感知哈希算法;3)基于音频信号高频系数主分量分析和盲信号分离的脆弱水印算法;4)基于音频低频分量语谱图计算机视觉分析的音频感知哈希算法;5)基于最大似然估计的哈希序列映射算法;6)基于耳蜗图和相干递归分析的音频感知哈希算法。理论分析和实验验证表明基于感知哈希和脆弱水印的音频安全保护模型可成功解决基于多目的水印算法安全模型所固有感知质量难以保证、不同性质水印之间容易产生相互干扰、以及不具备抗MP3压缩能力等问题。