东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于层次划分的密度优化聚类算法

ISSN号：1001-9081
期刊名称：《计算机应用》
时间：0
分类：TP301.63[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：[1]山东师范大学信息科学与工程学院,济南250014, [2]山东省分布式计算机软件新技术重点实验室,济南250014
相关基金：国家自然科学基金资助项目（61572301,90612003）; 山东省自然科学基金资助项目（ZR2013FM008）

关键词：聚类算法, 层次划分, 最佳聚类数, 初始聚类中心, 聚类有效性指标, clustering algorithm, hierarchical division, optimal cluster number, initial cluster center, clustering validity index

中文摘要：

针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化（CODHD）。该算法基于层次划分,对计算过程进行研究,不需要对数据集进行反复聚类。首先,扫描数据集获得所有聚类特征的统计值;其次,自底向上地生成不同层次的数据划分,计算每个划分数据点的密度,将最大密度点定为中心点,计算中心点距离更高密度点的最小距离,以中心点密度与最小距离乘积之和的平均值为有效性指标,增量地构建一条关于不同层次划分的聚类质量曲线;最后,根据曲线的极值点对应的划分估计最佳聚类数和初始聚类中心。实验结果表明,所提CODHD算法与预处理阶段的聚类优化（COPS）算法相比,聚类准确度提高了30%,聚类算法效率至少提高14.24%。所提算法具有较强的可行性和实用性。

英文摘要：

The traditional clustering algorithms cluster the dataset repeatedly,and have poor computational efficiency on large datasets. In order to solve the problem,a novel algorithm based on hierarchy partition was proposed to determine the optimal number of clusters and initial centers of clusters,named Clusters Optimization based on Density of Hierarchical Division（ CODHD）. Based on hierarchical division,the computational process was studied,which did not need to cluster datasets repeatedly. First of all,all statistical values of clustering features were obtained by scanning dataset. Secondly,the data partitions of different level were generated from bottom-to-up,the density of each partition data point was calculated,and the maximum density point of each partition was taken as the initial center. At the same time,the minimum distance from the center to the higher density data point was calculated,the average of products＇ sum of the density of the center and the minimum distance was taken as the validity index and a clustering quality curve of different hierarchical division was built incrementally. Finally,the optimal number of clusters and the initial center of clusters were estimated corresponding to the partition of extreme points of curve. The experimental results demonstrate that,compared with Clusters Optimization on Preprocessing Stage（ COPS）,the proposed CODHD improved clustering accuracy by 30% and clustering algorithm efficiency at least 14. 24%. The proposed algorithm has strong feasibility and practicability.

同期刊论文项目

基于因特网的教育资源网格体系结构和服务理论研究

期刊论文 91 会议论文 12 获奖 2

分布式社交网络结构、资源共享及迁移算法研究

期刊论文 6

同项目期刊论文

Wavelength assignment for realizing parallel FFT on regular optical networks

在超立方互联网络中实现anycast通信模式的算法分析

一种网格环境下的资源协同调度算法

基于多任务拍卖的资源调度算法

基于P2P的网格资源发现机制研究

基于MPI的并行程序设计

网格中基于访问频率的数据复制管理策略

基于模拟退火算法的数据副本选择策略

基于信誉机制的P2P网络安全技术

网格环境中资源发现与监视机制的研究

P2P-Grid环境中基于流言传播的资源查找方法研究

网格环境中的资源发现机制研究

教育资源网格中的一种动态数据复制技术

基于双向拍卖的网格资源预留机制研究

一类连续随机型流量网络中流量分配的多目标优化问题

教育资源网格中资源的描述与组织技术

基于超市模型的文件复制策略

网格计算中间件的研究

一种基于XML的个性化的资源需求描述机制

教育资源网格体系结构及元数据模型研究

一种基于选路拓扑的抗毁性评估模型

一种新的网格资源管理与调度算法

基于P2P和移动代理的入侵检测系统研究

基于经济模型的网格cache的文件副本替换策略

一种有效的并行入侵检测系统流量分配策略

并行FFT通信模式在WDM双环网上的波长分配

综合颜色与纹理的图像检索

WDM双环网上Hopfield网的波长分配

矩阵乘在一组规则WDM光网络上的波长分配

双环网嵌入RP(k)网络

基于超市模型的网格资源分配方法研究

基于相似性度量方法的图像检索

信用风险优化模型及其智能计算

基于Globus的数据网格中副本定位策略

一种基于双向拍卖机制的网格资源调度方法

基于小世界原理的教育资源发现策略

元搜索引擎中的成员选择和结果合并策略研究

一种基于分层P2P结构的教育资源网格检索模型

基于网格环境的动态自适应信任机制研究

教育资源网格的副本定位策略研究

ERGRID中网格服务的性能分析

An adaptive policy gradient in learning Nash equilibria

无线局域网分布式安全检测系统的研究

一种含超级节点的P2P模型在数据复制中的应用

蚁群算法用于TSP的并行策略及模型

综合颜色和形状特征的图像检索

基于无线传感器网络的混合MAC协议

环-皮特森簇网格的资源搜索机制

一种新的异构无线传感器网络分簇算法

一种基于聚合度模型的WSNs双簇头分簇路由协议

节能高效的无线传感器网络非均匀分簇路由协议

基于本体的P2P网络资源检索算法研究

OMNeT＋＋平台上无线传感器网络仿真系统的研究

MIKAD：一种多兴趣聚类的P2P网络模型

一种实用的互联网络RP_n（k）及其路由算法

一种基于多主题的网络模型构建算法

支持串模糊匹配的Chord扩展资源索引模型

教育资源网格监控系统的设计与实现

层次环网络的教育资源共享结构及相关策略分析

一种基于RP（k）的资源感知模型研究

基于Sierpinski分形垫的确定性复杂网络演化模型研究

基于蚁群算法的非结构化P2P网络资源搜索策略

一类层次双环网络的构造及其路由算法

基于访问量预测的教育资源网格副本放置策略

网格环境下文件远程访问的设计与研究

基于GMA的教育资源网格监控研究

基于GLOBUS的教育网格副本创建策略研究

P2P—Grid环境中基于流言传播的资源查找方法研究

基于效益函数驱动的网格资源调度算法研究

无线传感器网络中基于定时器的非均匀分簇路由算法

基于分治策略的改进人工蜂群算法

基于教育资源网格的信息检索策略

改进的多数据流协同频繁项集挖掘算法

基于巴氏系数和Jaccard系数的协同过滤算法

基于文化算法的符号网络全局不平衡度计算

路径幂图、Flower Snark图及多锥图独立数

有关循环图C（n；{1，k}）的独立数的一些结果

基于网格覆盖的社交网络位置数据的保护方法

一种基于边数随机增长的BA网络模型

教育资源网格模型及副本创建策略

基于跳数修正和跳距调整的DV-Hop定位改进算法

无标度立体Koch网络上随机游走的平均吸收时间

一种链路不相交的多约束QoS路由算法

基于WebService的网格服务功能的研究

基于加权聚类的动态协同过滤推荐算法

改进的多数据流协同频繁项集挖掘算法

基于巴氏系数和Jaccard系数的协同过滤算法

基于文化算法的符号网络全局不平衡度计算

基于加权聚类的动态协同过滤推荐算法

基于上下文学习和张量分解的个性化推荐

期刊信息

《计算机应用》
北大核心期刊（2011版）

主管单位:四川省科学技术协会
主办单位:四川省计算机学会中国科学院成都分院
主编：张景中
地址：成都市人民南路四段九号科分院计算所
邮编：610041
邮箱：xzh@joca.cn
电话：028-85224283

国际标准刊号：ISSN：1001-9081
国内统一刊号：ISSN：51-1307/TP
邮发代号:62-110

获奖情况:
全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:53679