视觉注意机制能够让视觉系统优先选择视野中感兴趣的物体和区域,在图像理解和识别中发挥着重大的作用。引入视觉注意模型到基于内容图像检索和浏览相当有必要。针对现有工作使用单一且不准确的视觉注意模型和固定的刚性图像相似性度量方法,本项目提出融合刺激驱动和目标驱动两种视觉注意模型来进行图像检索和浏览的方法。研究基于学习用户视觉跟踪数据的刺激驱动模型;研究通过图像检索中的相关反馈技术建立目标驱动模型;研究基于视觉注意信息的柔性图像相似度度量方法;研究基于视觉注意信息的图像浏览技术以及和图像检索技术的相互协作。这些研究的开展将进一步丰富视觉注意机制在图像处理中的应用和提高图像检索的性能,具有较好的理论和应用价值。研究成果可应用于民用、军事等相关领域。
Image browsing and retrieval;Computational visual attention;;;
按照申请书计划,本项目围绕视觉注意计算模型和基于内容图像检索和浏览技术展开深入研究,提出了一系列新方法和新模型,成功地解决了将视觉注意用于图像检索和识别应用这一难点问题。主要取得的代表性工作包括1) 提出结合稀疏编码和物体特征的视觉注意刺激驱动模型;2) 提出融合空域信息和频域谱信息的视觉注意刺激驱动模型;3) 提出基于融入空间信息的物体特征描述的图像检索模型;4) 提出基于相关排序的图像浏览和检索模型;5) 提出融合脑功能可计算特征的视频检索和分类新模型;6) 提出基于视觉注意模型的图像目标检测和分类模型。本项目研究产生了一批高水平研究成果,发表(含录用)SCI收录国际期刊论文19篇,国际会议论文5篇,国内期刊论文5篇,其中JCR二区以上论文9篇。获授权国家发明专利2项。培养博士后2名,博士研究生5名,硕士研究生4名。很好地完成了项目预期目标。