随着图像数据量的迅速膨胀,对图像信息的分析理解和有效利用已成为亟待解决的问题。本项目拟结合申请人的前期工作,基于人眼视觉选择性注意模型,尝试采用结构化学习的思想,研究对图像进行多层次语义解析的结构化图像分析方法。将把视觉特征信息用于图像的分析处理中,以提高分析处理的性能。并将针对图像分析中的特定任务,设计一种结合自底向上和自顶向下选择性注意机制的视觉计算模型,计算得到的图像显著度信息不仅可作为结构化学习中的基本特征用于图像的分析识别,还将有效处理结构化学习处理结果的"虚警"问题。本项目的研究成果可被广泛应用于视频监控、医学图像分析、互联网搜索引擎等领域中。
Visual Attention Model;Structured Learning;Image Analysis;Object Detection;Image Classification
本项目重点研究了视觉选择性注意模型,提出了一种基于多尺度上下文特征合并的自顶向下的视觉显著性计算模型和一种基于子块上下文空间合并的物体显著性检测算法。在图像场景表示方法的研究中,提出了一种基于组合形状字典的七巧板图像场景表示模型,并在此基础上提出了一种基于多层空间聚集的图像分类方法和一种结合局部特征和空间关系的物体检测模型。对于图像中物体间可能存在的各种空间关系,提出了一种基于对比聚类的空间关系模型和一种用于多物体检测的纺锤模型。结合显著性注意模型,提出了一种混合监督学习的物体显著性检测方法。在图像中的行为识别分析中,提出一种基于推广时空金字塔匹配核的视频中人体行为分类方法、一种基于Acton表示的视频中人体行为识别方法和一种基于关键子段挖掘的人体动作识别方法。在本项目的研究过程中,还提出了一种基于多尺度边缘特征的图像质量评价方法和一种基于像素域统计特征的半参考图像质量评价方法。