无监督聚类分析是模式识别与数据挖掘等研究领域中最基本的数据分析工具之一,研究快速有效的聚类算法具有重要的科学意义。不同于大多数传统聚类算法,本项目将一般聚类分析问题转化为可视化的图像处理问题。特别地,面向大规模数据集,本项目拟解决聚类分析中聚类数的自动估计问题、聚类自动划分问题以及聚类质量的自动校验问题,同时测试所开发的大尺度可视化聚类分析算法在实际视觉计算中的应用,如高分辨率的图像分割、基于图像的目标识别及视频中行为模式分析等。本项目的研究意义在于采用视觉处理方法可视化地解决聚类分析中的几个重要问题,不仅增强了数据分析的直观可视性和结果的可解释性,而且大大提高了数据聚类分析的准确度,更为开发新颖的聚类分析算法提供了新的研究途径和方法。
Pattern Recognition;Clustering;Visualization;Large-scale;Unsupervised Learning
无监督聚类分析是模式识别与数据挖掘等研究领域中最基本的数据分析工具之一,研究快速有效的聚类算法具有重要的科学意义。面向大规模数据集,本项目针对聚类分析中聚类数的估计问题、聚类划分问题以及聚类质量评估问题开展研究,同时将所提出的聚类分析算法应用于实际的视觉计算任务中,如高分辨率的图像分割、基于图像的目标识别及视频中行为分析等。本项目不仅收集了一些类型丰富的数据集用于聚类分析实验,同时在大规模、多视角、半监督、部分视角等数据聚类方面提出了一些有效的方法,促进了模式识别领域无监督学习理论和方法的研究和发展。基于本项目的研究成果,已发表国际期刊或会议论文25篇,申请发明专利7项,撰写专著1部,培养已毕业博硕士5名、在读博硕士11名,圆满完成了本项目的预期目标。