位置:成果数据库 > 期刊 > 期刊详情页
采用属性聚类的高维子空间聚类算法
  • ISSN号:1007-5321
  • 期刊名称:北京邮电大学学报
  • 时间:0
  • 页码:29-36
  • 语言:中文
  • 分类:TN929.53[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]北京邮电大学网络与交换技术国家重点实验室,北京100876, [2]中国电信北京研究院决策研究部,北京100035
  • 相关基金:国家“973计划”项目(2007CB307100);国家自然科学基金项目(60432010)
  • 相关项目:智能移动业务平台的基础性研究
中文摘要:

为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意2个非冗余属性的相关度,进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.

英文摘要:

Many recently proposed subspace clustering methods suffer from two severe problems: First, the algorithms typically scale exponentially with the data dimensionality or the subspace dimensionality of clusters. Second, the clustering results are often sensitive to input parameters. A fast algorithm of subspace clustering using attribute clustering is proposed to overcome these limitations. This algorithm first filters out redundant attributes by computing the gini coefficient. To evaluate the correlation of each two non-redundant attributes, the relation matrix of non-redundant attributes is constructed based on the relation function of two dimensional united gini coefficients. After applying overlapping clustering algorithm on relation matrix, the candidate of all interesting subspaces is achieved. Finally, all subspace dusters can be gotten by clustering on interesting subspaces. Experiments on both synthesis and real datasets show that the new algorithm not only achieves a significant gain of runtime and quality to find subspace clusters but also is insensitive to input parameters.

同期刊论文项目
期刊论文 62 会议论文 44 专利 14
同项目期刊论文
期刊信息
  • 《北京邮电大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:北京邮电大学
  • 主编:刘杰
  • 地址:北京海淀区西土城路10号195信箱
  • 邮编:100876
  • 邮箱:byxb@bupt.edu.cn
  • 电话:010-62281995 62282742
  • 国际标准刊号:ISSN:1007-5321
  • 国内统一刊号:ISSN:11-3570/TN
  • 邮发代号:2-648
  • 获奖情况:
  • 美国工程信息公司(Ei)数据库收录期刊,1999年全国优秀高等学校自然科学学报及教育部优秀...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:7684