人类对图像的感知是多角度和整体性的,为了能使计算机正确理解图像的语义,可以用颜色、形状、纹理等各种各样的底层视觉特征向计算机多角度描述图像的视觉属性。颜色、形状、纹理虽然同是图像的视觉特征,但它们之间是异构的,一般不具有可比性。在大规模图像分类任务中,数据集各个局部的分布也往往是异构的,从而不同局部的距离测度也不具有可比性。本项目主要研究高维异构数据的测度学习算法及在图像分类中的应用,具体研究内容有研究如何使图像的异构视觉特征具有相互可比性,从而能度量用不同视觉特征表示的图像间的相似度;研究多测度学习算法,从而使服从不同分布的数据块上的距离测度具有一致性;研究大规模数据集上如何降低计算代价,实现增量式方法以适应动态增长的图像数据集;研究语义间相关性的挖掘,使计算机模拟人脑中最自然的思维方式,实现从不同角度对图像的自动分类。
Feature Extraction;Multi-label Learning;Machine Learning;Image Classification;
本项目主要研究高维异构数据的测度学习算法及在图像分类中的应用,提出了一种多核多标记的测度学习算法,研究基于高维异构特征的图像相似度学习,通过多个核函数的线性组合更精确地刻画图像之间的相似度,使具有相同标号或者相关标号的图像之间相似度尽可能大;利用核的特征函数,新测试数据和训练样本之间的距离测度可以在线计算,实现增量式方法以适应动态增长的图像数据集;初步探索了大规模数据集上如何降低计算代价;研究多标记学习中语义相关性的挖掘,充分利用视觉上下文、语义上下文、视觉特征空间和语义特征空间这两种异构特征空间中的相似度一致性,从而提高图像分类的精度;从全局和局部等不同视角提取图像异构特征,使计算机模拟人脑中最自然的思维方式,实现从不同角度对图像的自动分类。我们发表论文6 篇,其中包括中国计算机学会(CCF)A 区会议论文4 篇(即IJCAI 1 篇、ICCV 2 篇、CVPR 1 篇)。