人眼视觉系统理论,是图像和视频处理方法的重要理论依据。最近对人眼视觉系统的理解有了新的突破,提出了结构信息理论,该理论认为人眼视觉系统的主要功能是从图像中提取结构信息。因此结构信息失真应该是对图像视觉失真的最好近似。但还没有一个完善的被国际承认的结构信息失真测度,而结构信息失真测度是结构信息理论很重要的一部分,是设计新的图像和视频压缩方法的重要理论依据之一。本课题将主要对结构信息失真测度及其在图
人眼视觉系统理论的发展,是图像和视频处理方法发展的理论基础。本项目基于新的人眼视觉系统的结构信息理论,对结构信息失真测度及其在图像和视频压缩方面的应用做了深入的研究。在图像质量评价方面,提出了4种结构信息失真测度,分别为基于梯度的结构相似度;基于边缘的结构相似度;基于块分类的加权结构相似度;小波域的结构相似度。所提方法能较好的评价图像质量,且可方便的用于图像处理算法中,优化算法。研究结果对图像和视频处理理论的发展有重要指导意义。在静止图像压缩方面,研究并发现了小波域的结构信息特性;实验证明了人眼对第二、三分解级的结构信息失真最为敏感;这些结论为研究使结构信息失真最小的静止图像编码方法提供了理论基础。在视频编码方面,提出了采用结构相似度(SSIM)作为失真测度,进行运动估计和模式选择的思想;提出了基于SSIM的帧内模式选择方法;基于SSIM的帧间运动估计方法;并提出了两种快速算法;在解码视频质量不下降的条件下,可明显的提高压缩率,所提快速算法可明显降低编码的复杂度。基于结构信息失真最小的图像/视频编码方法的研究结果为图像/视频压缩提供了新的研究思路。