聚类是人类社会处理数据最基本的的手段, 但是由于客观世界的丰富多彩,使得所要的数据集常常处于异常复杂的流形分布状况,而现有的多数聚类方法或者不能精确地分类这些多样性的数据,或者不能自动确定聚类的个数。本项目拟研究建立包括基于多中心点表达的AP、基于图理论的非线性AP、基于核方法的竞争学习聚类、基于K近邻图理论的竞争学习聚类、研究基于支持向量的增量聚类等若干可以自动确定聚类个数的非线性聚类的新方法,同时,研究基于这些新算法的扩展方法,包括但不限于流数据聚类方法、半监督方法和高维数据的快速聚类算法等,并研究利用获得的新结果解决场景图片的分类、人脸图像的分类、视频数据挖掘、图像分割等图像分析中若干关键的科学问题。力争在相关理论方法、核心技术等方面有所突破,总体上达到国际先进水平。该项目的研究成果将大大丰富模式识别、机器学习和数字图像处理的理论成果。
Nonlinear Clustering Methods;Image Analysis;Affinity Propagation Clustering;Competitive Learning;Support Vector Clustering
本项目面向复杂数据集的数据聚类处理的应用需求,针对非线性聚类方法,研究可以自动确定聚类个数的非线性聚类的新方法,同时,研究基于这些新算法的扩展方法,包括但不限于流数据聚类方法、半监督方法和高维数据的快速聚类算法等,并研究利用获得的新结果解决场景图片的分类、人脸图像的分类、视频数据挖掘、图像分割等图像分析中若干关键的科学问题。通过本项目的研究,取得了一批有意义的研究成果。特别是在以下几个方面取得了具有较大创新性的成果。1.非线性近邻传播聚类方面,提出了新的基于多中心点的算法,能够对复杂的具有多子类结构的数据进行建模。2.在基于核方法的竞争学习聚类、基于图模型的聚类方面,提出了多粒度组合聚类方法,加权图流中检测动态社区的算法,基于因子图的自动集成聚类方法等方法并应用于图像处理和数据挖掘等领域。3.在基于支持向量的增量聚类方面,提出了一种位置正则化的支持向量域描述算法,基于支持向量域描述及支持向量聚类的SVStream流数据聚类方法,提出了一种基于多局部模型的多数据域描述的图像集合匹配方法等。4. 在大规模非线性聚类方面,主要研究了非线性聚类的方法,克服了普通核聚类算法的计算量大的缺点,将线性不可分的数据能更好地投影到高维空间中进行线性划分,主要应用于图像分类中。该项目共发表学术论文53篇,其中IEEE Trans.刊物的论文7篇,Pattern Recognition 5篇,被SCI 检索论文33篇,被EI 检索论文49篇。申请国家发明专利9件,共申请计算机软件著作权4项。本项目资助的博士和硕士研究生获得2014、2015全国研究生智慧城市大赛一等奖各一次,获得2014第十七届全国图像图形学术会议优秀论文奖。本项目已经培养青年学术带头人 1人、博士20 名、硕士研究生40名。项目组主办或参与承办了多项国内外同行学术大会,促进了国内外同行间的交流与合作。