随着数字多媒体技术及宽带网络技术的飞速发展,视频篡改快速检测及定位技术研究是目前视频安全应用中急需解决的问题,视频媒体由于其特征复杂性及其海量数据特性,成为制约视频安全研究及相关学科发展的一大瓶颈。本项目拟引入人类视觉可计算模型,采用随机分块采样技术,提取视频结构感知特征及视频画面时域感知特征,利用哈希理论的单向摘要特性量化感知特征,获取视频感知哈希。项目拟采用视频分段及哈希位串分段组织策略,构造以7位哈希位串为单位、自小至大、自上至下的视频段标记快速索引算法,根据感知哈希相似度计算及阈值分析,实现视频保持操作及视频窜改操作的快速检测。项目拟采用对哈希位串双向滑动窗口逼近匹配算法,及采用多层次递进的多粒度定位技术,实现视频篡改从粗粒度到细粒度快速定位,这种多层次的循环逼近的定位技术,使得视频篡改的快速、精确检测与定位成为可能,为视频篡改实时检测及视频帧内篡改定位提供技术支撑及理论支撑。
Perceptual Hash;Spatiotemporal Feature;Video Tampering detection and positioning;Sliding Window;
1、研究背景视频信息以其丰富生动的表达能力而被广泛应用且发展迅猛,与此同时针对视频信息的非法操作(如版权窃取、内容篡改)随之而来,由于其海量数据特性,多年来的研究面临诸多挑战。本项目在当前热点讨论的感知哈希背景下,致力于视频篡改检测与定位的技术研究,围绕视频感知特征提取、视频哈希量化、快速检索模型及篡改检测与定位等几个问题进行深入研究。 2、主要研究内容 1)基于结构特征及时域特征的视频感知特征研究引入了视觉感知理论,以视觉影响较大的亮度、灰度、色差作为主要特征进行研究。在空域(结构)特征提取上,对视频帧进行可随机分块,利用相邻分块的亮度差作为分块的感知特征;在时域特征提取上,对连续视频帧进行规范化分块,采用前后视频帧在相应分块上的亮度差值作为分块感知特征;在混合特征研究上,采用规范化的视频帧分块,以空域特征与时域特征之和作为混合特征。通过阈值分析进行视频特征哈希量化,生成视频哈希秘钥串。 2)基于快速搜索表的视频篡改快速检测技术研究为了获得快速篡改检测与定位,采用三维快速检索矩阵结构,在XY平面上,X轴表示8位二进制的组合,Y轴表示某一视频段哈希位串组的编号(每8位哈希为一个哈希位串组),Z轴表示不同的视频段,构造快速检索及定位模型。 3)基于滑动窗口及前后逼近的多粒度视频篡改快速定位技术研究原始视频与篡改视频采用相同的特征提取及哈希量化,把原始视频和篡改视频放在不同的三维快速检索矩阵上,通过原始视频矩阵与篡改视频矩阵的滑动及相似度比较,判定视频篡改。 3、重要结果、关键数据及其科学意义等 1)发表论文18篇,其中期刊论文10篇,会议论文8篇,SCI/EI论文12篇(二区以上SCI论文4篇); 2)培养了8名研究生,7名本科生; 3)申请了3个发明专利(进入实质审查公布阶段); 4、获得2012年深圳高新技术成果交易会优秀奖1个,获得国际会议优秀论文1篇; 5、获得国家基金委及深圳市项目后续资助278万; 6、依托本项目研究成果组建了广东省教育厅“中英合作视频信息处理实验室”,科研成果与企业合作,产生了2800万元的经济收入。本项目研究成果作为核心技术将在多目标视频目标跟踪及加密摄像头芯片制造等领域得到应用和推广,产生巨大经济和社会效益,具有重要研究意义。