在数字水印研究中,鲁棒性是一个关键问题。至今,现有的绝大多数音频水印算法仅仅能够对抗类似于加性噪声的常规处理操作,而对一般同步攻击的性能不理想,特别是缺乏可有效抵抗联合攻击(常规处理与同步攻击的组合)的水印策略。这表明数字音频水印抗联合攻击依然是一个富有挑战性的研究课题。本项目针对音频水印的应用前景,重点研究可有效抵抗联合攻击的强鲁棒音频水印技术。主要内容包括构建基于音调、音符、坡度和梯度的稳定特征点检测器;利用特征点设计符合水印需要的鲁棒音频分段方法;构造局部统计特征(包括累积直方图和变换域直方图),分析其不变特性;设计全新的基于人耳掩蔽特性的音频直方图修改方法(即水印嵌入方案)等。通过研究,试图解决数字音频水印抗联合攻击的几个关键问题,建立起可有效抵抗联合攻击的强鲁棒音频水印系统原型,发展和完善基于局部不变统计特征的数字音频水印理论,为音频媒体知识产权的数字水印保护做出理论上的贡献。
Audio watermarking;Synchronization attacks;Histogram;Reversible watermarking;Media hashing
项目“基于音频局部不变统计特征的鲁棒水印关键技术研究(编号60903177)”得到了2009年国家自然科学基金青年基金的资助,执行期限为2010.01—2012.12。项目主要研究数字音频水印抗裁剪和时域拉伸的同步攻击问题。自项目立项以来,项目组一直按照研究计划有序进行,分别对鲁棒音频分段、基于离散小波包变换的心理声学模型、低频域直方图特征等问题进行了深入研究,并构建了几个强鲁棒音频水印算法。该算法能同时抵抗常规信号处理操作(通过将水印嵌入在低频域)和自由裁剪(通过使用局部特征)、时域拉伸(通过使用直方图统计特征)等同步攻击,很好地完成了项目要求。主要成果在2010数字水印国际会议上做报告陈述并发表在到国际刊物《EURASIP Journal on Advances in Signal Processing》。 在项目的支持下,除了在音频水印方面直接取得成果之外,还在相关研究方向可逆数字水印和多媒体哈希两个主要方面取得了一些好的成果。在可逆水印方面,提出了基于非整数预测误差扩展的无损信息隐藏算法,该算法能很好地发挥预测器的性能和避免了传统基于整数预测误差扩展算法中预测值取整时造成的失真问题,从而在相同嵌入率下有更少的嵌入失真,相关成果在2012国际信息隐藏学术会议(Information Hiding)上做报告陈述,进一步的研究计划得到了国家自然科学基金面上项目(编号61272414)的资助。在多媒体哈希方面,提出了基于直方图统计特性的图像、视频哈希算法和基于非负矩阵分解(NMF)的图像哈希算法,所提出的基于直方图统计特性的图像、视频哈希算法对图像、视频中的几何攻击具有很好的鲁棒性,所提出的基于NMF的图像哈希算法能更好地处理旋转操作带来的认证问题,相关成果发表到《中国科学 F辑》、《EURASIP Journal on Advances in Signal Processing》和《Multimedia Tools and Applications》等国内外核心刊物。 在项目的支持下,主要发表相关学术论文16篇,其中SCI检索4篇,EI检索6篇,ISTP检索3篇;申请软件著作版权1项(已取得申请号);正在申请发明专利1项(已取得申请号)。作为主要参与人(排名第十)项世军博士获得了“教育部2012高校科研优秀成果奖”自然科学奖一等奖。