本项目针对图像/视频处理的难点,将在远程医疗/自动导航、视频会议/公安、彩信监控、互联网图像分析及检索等重要领域发挥促进作用。主要创新是 1.首次提出研究图像的编码和感知分析联合优化表示的思想及其关键问题。 2.提出一个分级结构化矢量表示思想来实现之,各级分别是1)基于格型多向小波时频原子函数的子空间结构诸元表示;2) HVS视觉熵最优的内容自适应空间规则划分;3)用结构元矢量表达信号的多模态聚类和方向特征,构造混合矢量子空间的描述。对复杂时变图像(如视频),生成描述能跟踪变化的结构。 3.其中的关键问题子空间规则划分的感知评价准则和微细结构/显著结构的感知熵、Directionlet基切换和基波形动态测量方法、时频原子-经典算子-备选结构的循环映射及其VQ表达,以及格型小波域2D-PT的数据转换准则和负载的预测传递,均是以前未见的创新工作。将实现码流内容的直接判断和率失真表示。
Latticed Directionlet;Vector Generation Model;Compressive Sensing;Sparse Dictionary;Rate-Distortion Optimization
本项目“基于格型多向小波基的图像表示及其压缩/感知联合优化的关键问题研究”的背景,着眼于图像/视频信号的高效描述和处理。首次提出编码和内容分析联合优化的描述生成模型,它在远程医疗/自动导航、视频会议/彩信监控、互联图像分析及定位检索等重要领域发挥促进作用。项目的主要贡献是1. 新的格型多向小波分析实现及其图像非线性逼近性能评估。 2. 提出一个分级结构化矢量生成模型,由3级描述组成1)基于格型多向小波时频原子的子空间结构元;2) 以HVS视觉感知熵最优为目标函数的内容自适应空间规则划分,用结构元的伸缩和加权叠加逼近子空间;3)用结构元矢量表达信号的多模态聚类和方向特征,构造混合矢量子空间的描述模型。 3. 针对1D-PT的2D不适用性,提出格型小波域2D-PT,用作生成描述的预处理,并给出其数据转换准则和负载预测,使模型描述与目标更好匹配。 4. 建立时频原子-->经典算子-->备选结构映射及其VQ表示,实现码流描述内容的直接判断,建立多尺度信号内容直接分析方法。 5. 建立编码/分析联合优化描述,并跟踪复杂时变图像变化,实现最优率失真描述。项目研究成果发表在Expert Sys. Appl.,Electron. Lett.,Patt. Recogn. Lett., IEICE Tran. Info.& Sys.,IEICE ElEx.,Optics Comm., Int J.Electron.& Comm.,J.Electron.等国内外重要期刊和ICASSP、MMSP等重要国际会议上,共发表SCI索引的刊物论文8 篇,EI索引的刊物和IEEE国际会议论文11篇。成果受到同行认可并引用。获得发明专利1项;相关成果已获得广东省产学研合作主持项目1项。项目培养人才包括已毕业博士生1名,在校博士生3名;培养已毕业硕士生12名,在校硕士生12名;与法国南特大学合作交换学生3名。