随着图像和视频资源的日益增多以及社会对智能图像处理技术需求的不断提高,目标类识别问题已经成为一个迫切需要解决的课题。由于隐式形状模型合理刻画了局部特征之间的位置关系,在目标类识别中被广泛采用。但是,该方法在局部特征提取、高维数据降维、码本聚类和在线搜索等方面仍然存在不足,导致检测率不高和在线检测速度慢等突出问题。本项目将针对目标类识别中隐式形状模型的相关理论和技术展开深入研究,采用大间距原则对局部特征进行降维处理,提高低维局部特征的辨别力;采用非线性聚类和流形学习方法生成码本并且构造码本的非线性流形结构,准确地计算特征与码本之间的相似度;采用以局部特征为中心的高效子窗口搜索算法,提高在线检测速度。通过本项目的研究,可望在高维数据降维、非线性聚类和快速搜索等问题上有所进展和突破,并且以此为基础提出目标类识别新算法,使之应用于车载环境, 构建一个车辆和行人自动识别原型系统。
probabilistic graphical models;Markov random field;spectral clustering;exemplar-based clustering;SFM
本项目针对目标类识别研究问题,主要研究了以下基本问题(1)针对马尔可夫随机场上最大后验概率推断问题展开研究,提出了一种解决一般马尔可夫随机场上最大后验概率推断问题的算法,并且解决基于样例的数据聚类问题;(2)针对谱聚类的相似性度量、近邻图的构造和大数据集上的快速计算等方面展开了深入的研究,提出了一种基于局部插值的快速谱聚类算法,并针对谱聚类问题提出了一种基于最大流相似性度量的的相似矩阵构造;(3)针对已有SFM三维重建算法存在的问题,研究一种新的SFM三维重建实现方案,实现了无特征提取的紧致三维重建。