聚类分析在图像识别,图像分类和信息检索等领域中有着重要的作用。单个聚类算法由于其适用的领域和问题不同,用户在选择不当时,效果往往不尽人意。另一方面,不变性识别需要新的技术来减少模型学习所需要的监督程度和有效融合多种信息。聚类集成技术在不同的数据集和假设空间中都有较强鲁棒性。本项目通过分析研究聚类集体影响聚类集成效果的因素,建立评价聚类集体质量的评估函数,然后研究自动生成一个好的聚类集体的方法;在此基础上,根据评估函数和生成的聚类集体的特点确定适用的集成方法。最后,研究在不变性识别这种特定应用情况下,研究实现不变性识别的特征提取和描述的聚类集成学习算法,研究如何应用自动聚类集成技术,只利用少量的监督样本,或甚至只是依靠以前的学习经验和知识来建立物体模型。项目的研究将进一步完善聚类集成的理论与应用体系。
ensemble learning;clustering;Invariant recognition;;
将聚类集成中的关键问题的研究融合到图像识别和视频识别研究中,进而促进对聚类集成的理论研究。具体取得的研究成果如下 (1)对聚类集体的差异性度量进行了研究,基于分类集成中的一些度量提出了四种聚类集体差异性度量。实验结果表明当平均聚类成员准确度高于0.6,集体大小为15到20左右,待聚类数据集有均匀簇分布时,各种差异性度量与集成方法性能间的相关程度很高。并且在比较不同的集成算法在同一个聚类集体上的集成性能时,发现与差异性度量相关系数更高的集成算法,集成性能也更好。 (2)提出了一种基于数学形态学的聚类分析算法,它将用于图像处理的方法引入聚类分析,利用不同结构元素的探针作用,对不同结构元素探测出来的簇核心进行集成,在集成所得到的簇核心基础上,根据集成所得簇核心的个数确定簇个数。 (3)提出了在生成聚类集体的过程中人为加入噪声数据以增加聚类集体的差异性的方法。并进一步提出利用人工附加数据生成一个比较大的聚类集体后,选择差异成员组成一个更小但差异性更大的聚类集体的算法。此算法在数据集比较小,特征少,从而用传统方法不足于产生一个差异性聚类集体时比较有效。 (4)从聚类集成的角度研究了不变性识别问题,利用聚类集成技术建立视觉词汇本集体,提出了六种构造视觉词汇本集体的方法,利用视觉词汇本集体来表征图像多方面特征,并将其应用于物体识别中,得到了良好的效果。 (5)在基于自动聚类集成技术的图像分类模型研究中,提出了一种集成多特征与稀疏编码用于图像分类的算法。利用集成的方法,结合多种可用于提高图像分类性能的方法来分类图像。提出了利用空间视觉词汇本集体加权的方法来建立图像分类器模型,整合了空间信息来得到比较好的分类效果。 (6)提出一个方向计算的双层网络模型。数值仿真实验表明,提出的模型能够很好地模拟简单细胞的方向选择性,能够从复杂图像提取出满意的方向图。 (7)提出了一种基于分割集成的行人检测方法。将集成学习的思想用于行人检测中,针对建立模型单一,只选取若干块进行检测的不足,提出通过不同的局部分割方法建立多个全局分类器,通过集成多个全局分类器的分类结果来提高检测效果。 (8)对视频中的目标跟踪进行了研究。利用集成学习思想,融合多种目标特征,建立多个目标模型,并行进行检测和跟踪,得到较好的跟踪效果与跟踪速度。