位置:成果数据库 > 期刊 > 期刊详情页
基于粗糙集的高维分类型数据子空间聚类算法
  • ISSN号:1001-4217
  • 期刊名称:汕头大学学报(自然科学版)
  • 时间:2012
  • 页码:46-53
  • 分类:TP306.1[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]汕头大学工学院,广东汕头515063
  • 相关基金:国家自然科学基金资助项目(61170130)
  • 相关项目:高维混合型数据聚类及应用研究
中文摘要:

现有的优秀的聚类算法大多是处理低维数据的,但是对于高维数据,由于其分布特性与低维情形有很大的差异,这些算法失效.为解决高维分类型数据聚类问题,提出了一种基于粗糙集的高维分类型数据子空间聚类算法,基于粗糙集的上、下近似集的类边界描述,确定了类边界范围,然后采用相容度来调整类边界,聚类的过程采用增长子空间的思想,从低维到高维迭代地搜子空间类簇.最后通过在soybean、zoo数据集上的对比实验,实验结果表明了算法不仅可行,而且精度高.

英文摘要:

The existing excellent clustering algorithms are mostly used in processing the low dimensional data. For high dimensional data, its distribution characteristics are different from the low dimensional case. These algorithms fail to solve the high dimension data clustering problem. A clustering algorithm is presented based on the rough set and high dimensional categorical data subspace. The rough set's up and down approximations set to describe the class boundary, thus determine the range of boundary. The consistency degree is used to determine the clustering. The clustering process uses the growth subspace idea. Finally, good results are obtained through the experiment on the soybean, zoo data set. Results show that the algorithm is feasible and has high precision.

同期刊论文项目
期刊论文 9 会议论文 7
同项目期刊论文
期刊信息
  • 《汕头大学学报:自然科学版》
  • 主管单位:广东省教育厅
  • 主办单位:汕头大学
  • 主编:尹业高
  • 地址:广东省汕头市大学路243号
  • 邮编:515063
  • 邮箱:cjf@stu.edu.cn
  • 电话:0754-82903827
  • 国际标准刊号:ISSN:1001-4217
  • 国内统一刊号:ISSN:44-1059/N
  • 邮发代号:46-17
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:1767