高维空间聚类是当前数据挖掘领域一个急待解决的关键问题,在海量数据的情况下,这个问题就更加突出。本项目重点研究高维空间数据划分的新模型和新的聚类合并技术,试图用基于数学理论维的方法解决海量高维数据挖掘问题,为海量高维数据的快速聚类寻找有效的计算理论和方法。主要研究内容包括高维空间聚类中划分及合并方法、聚类的边界和噪声处理方法、聚类参数的研究、多密度聚类的处理技术以及高维海量复杂类型数据聚类的关键技术等。项目研究取得了一些创新性成果,在期刊、会议上发表论文27篇,其中SCI、EI检索15篇。部分研究成果参与的“数据挖掘及其应用基础研究” 项目荣获2009年教育部高等学校科学研究自然科学二等奖。本项目的研究有助于建立快速聚类的理论模型和算法,实现对海量高维数据的快速数据挖掘,为人工智能提供新的计算理论和方法,为中文信息处理提供理论支持。
英文主题词clustering algorithm;high-dimension spatial massive data;boundary points processing;multi-density data set;complex type data