位置:成果数据库 > 期刊 > 期刊详情页
面向不确定数据的近似骨架启发式聚类算法
  • ISSN号:0469-5097
  • 期刊名称:《南京大学学报:自然科学版》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]皖西学院信息工程学院,六安237012, [2]大连理工大学软件学院,大连116621, [3]中国科学与技术大学计算机科学与技术学院,合肥230027
  • 相关基金:国家自然科学基金(61073110); 安徽省自然科学基金面上项目(1208085MF95); 安徽省教育厅自然科学基金重点项目(KJ2012A273,KJ2012A274); 留学人员科研活动项目择优资助项目
中文摘要:

不确定数据聚类是传统数据挖掘的扩展,面对不确定数据聚类,研究者们经常把聚类问题描述成组合优化问题,并设计启发式聚类算法进行求解.现有的启发式聚类算法,如UK-means和UK-Medoids具有容易理解和实现简单等优点,但初始解敏感问题严重影响了聚类质量.本文在近似骨架理论的基础上,提出了一种近似骨架启发式聚类算法APPGCU(Approximate backbone guided heuristic clustering algorithm for uncertain data).该算法首先对原数据集完成P次采样,在采样后的规模较小的P个数据集上分别执行UK-Medoids算法得到P个局部最优解;然后通过对P个局部最优解求交得到近似骨架,并从中提取初始簇心;最后从初始簇心开始,启发式搜索出聚类结果.在仿真和实际数据集中的实验结果表明,算法APPGCU的聚类结果明显高于实验对比的启发式聚类算法,提高了聚类质量.

英文摘要:

As an extension of traditional data mining,uncertain data clustering gets wide interest of researchers.Uncertain data clustering is equivalent to a combinatorial optimization problem,and researchers usually solve it by using heuristic algorithms.As we knew,the existence heuristic clustering algorithms for uncertain data,such as UK-Means and UK-Medoids,are easy to be understood and to implemented,but these algorithms also have the initialization sensitivity problems which affect the clustering quality severely.In this paper,we propose an approximate backbone based heuristic clustering algorithm APPGCU(Approximate backbone guided heuristic clustering algorithm for uncertain data).In this algorithm,we first do Ptimes sampling on the original dataset,and run UK-Medoids on thePsampled datasets to get Psub-optimal solutions;then get the approximate backbone from the Psub-optimal solutions,and extract the initialization cluster center;eventually,re-run UK-Medoids with the initialization and get the solution by a heuristic search.The experiments on synthetic and standard UCI uncertain datasets demonstrate that APPGCU gets better clustering results than existing heuristic clustering algorithms,and improves the quality of clustering results.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《南京大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国教育部
  • 主办单位:南京大学
  • 主编:龚昌德
  • 地址:南京汉口路22号南京大学(自然科学版)编辑部
  • 邮编:210093
  • 邮箱:xbnse@netra.nju.edu.cn
  • 电话:025-83592704
  • 国际标准刊号:ISSN:0469-5097
  • 国内统一刊号:ISSN:32-1169/N
  • 邮发代号:28-25
  • 获奖情况:
  • 中国自然科学核心期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9316