位置:成果数据库 > 期刊 > 期刊详情页
具有容错特性的两层数据流聚类方法
  • ISSN号:1001-5965
  • 期刊名称:北京航空航天大学学报
  • 时间:2012.5.15
  • 页码:665-669+674
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]清华大学计算机系,北京100084, [2]中国医学科学院药用植物研究所,北京100193
  • 相关基金:国家自然科学基金资助项目(81102879)
  • 相关项目:基于脑代谢网络调节交叠性发掘的降香对丹参协同机制研究
中文摘要:

提出一种具有容错能力的进化数据流聚类算法FTGDStream(Fault-TolerantGrid-Density Clustering over Data Stream),通过在聚类过程中引入适当的松弛条件,从而在含有噪声的真实世界数据中获取更加泛化的有用知识.首先利用基于相似性度量和小波技术的HLSFTS(Hierarchical Lifting Scheme Fault-Tolerant Synopses)层次概要数据结构实现在线微聚类过程,然后采用基于网格密度的聚类算法实现离线宏聚类过程.在线算法所构造的小波概要数据结构对原始数据的高压缩率降低了离线网格密度聚类算法的计算负载,提高了二层数据流聚类算法的效率.在UCI数据集上的仿真实验结果表明,FTGDStream算法可以聚类任意空间形状的数据并且适用于高维数据流环境,是一种具有容错能力的高效数据流聚类算法.

英文摘要:

A new envolving data stream clustering algorithm with fault-tolerance characteristic was proposed named FTGDStream(fault-tolerant grid-density clustering over data stream).It introduces appropriate relaxation of conditions for discover generalised knowledge in real world data polluted by noise.First,FTGDStream uses similarity measure technology and lifting wavelet to construct synopsis HLSFTS(hierarchical lifting scheme fault-tolerant synopses) to realize online micro-cluster phase.Second,FTGDStream uses grid-density clustering technology to realize offline macro-cluster phase.High compression ratio of HLSFTS in micro-cluster reduces the computation load of grid-density clustering algorithm in macro-cluster and improves the efficiency of two-layer algorithm.Simulation in UCI data set proves that FTGDStream is able to clustering any shape in data space and suitable for dealing with high-dimensional data streams.FTGDStream is an efficient clustering algorithm with fault-tolerance.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京航空航天大学学报》
  • 北大核心期刊(2011版)
  • 主管单位:
  • 主办单位:北京航空航天大学
  • 主编:赵沁平
  • 地址:北京市海淀区学院路37号
  • 邮编:100083
  • 邮箱:JBUAA@buaa.edu.cn
  • 电话:010-82315594 82338922
  • 国际标准刊号:ISSN:1001-5965
  • 国内统一刊号:ISSN:11-2625/V
  • 邮发代号:
  • 获奖情况:
  • 第二届全国优秀科技期刊评比三等奖,全国优秀高等学校自然科学学报及教育部优秀科技期...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19939