图像语义理解是近年来计算机视觉中一个非常活跃的研究方向。本课题的研究目标是基于视觉认知理论实现图像的层次化语义标注。主要内容:(1)基于颜色认知理论中的颜色恒常性机理,研究如何提取自然图像的颜色不变性描述子;(2)针对区域级图像标注这一弱监督学习问题,研究如何采用多种学习策略相融合以改善区域级的标注性能,并对标注结果进行基本颜色词的描述,得到"视觉属性词+名词"的标注结果;(3)研究对标注关键词序列实现基于语义显著度和语义相关度的多标记排序。(4)研究基于情感认知理论的图像情感特征提取,并探讨基于情感特征的图像情感语义分类算法。本项目的特色是(1)以海量图像为研究对象,基于视觉认知理论实现图像的层次化语义标注,标注结果增加了符合人类感知的颜色词描述。(2)将颜色恒常性理论、稀疏表示理论及情感认知理论有机地融入到图像层次化语义理解中。
Image Saliency Analysis;Automatic Image Annotation;Sparse Representation;Multi-Instance Learning;Image Tag Ranking
本课题的研究目标是基于视觉认知理论实现图像层次化语义标注。 课题组成员围绕着既定的研究目标,经过三年的研究工作,取得了一系列的研究成果。代表性的研究内容包括1)提出了一种基于多任务低秩矩阵分解的图像显著性分析算法;2)提出了一种基于层次化稀疏表示模型的图像光照估计算法;3)提出了一种基于层次化稀疏表示模型的多示例半监督学习算法;4)提出了一种基于视知觉理论的海量社群图像标签自适应排序算法;5)提出了一种基于情感认知理论的图像情感分类算法;6)提出了一种基于基于混合相似性度量学习的图像检索算法; 在本课题的资助下,项目组成员取得了如下的研究成果 1)在IEEE Trans on Image Processing, IEEE Trans on CSVT, Pattern Recognition, Signal Processing, Computer Vision and Image Understanding, Neurocomputing, Journal of Visual Communication & Image Representation等知名国际学术期刊上发表SCI论文9篇; 2) 在领域内顶级国际学术会议CVPR, ECCV, ACM Multimedia及其他知名国际会议上共发表国际学术会议论文10篇; 3) 培养硕士研究生8名;