位置:成果数据库 > 期刊 > 期刊详情页
基于聚类和距离的大数据集离群点检测算法
  • 期刊名称:制造业自动化
  • 时间:0
  • 页码:101-104
  • 语言:中文
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国民航飞行学院计算机学院,广汉618307
  • 相关基金:国家自然科学基金资助项目(60879022)
  • 相关项目:基于核机器学习的民航飞行数据挖掘关键技术研究
作者: 王欣|
中文摘要:

针对已有的基于距离的离群点检测算法在大数据集上扩展性差的问题,提出了基于聚类和距离混合的大数据集离群检测算法。算法第一阶段采用层次聚类和k-means混合的层次k-means算法对数据进行聚类,并按照一个启发式规则对其进行排序。第二阶段在聚类的结果上采用嵌套循环算法进行离群检测,并通过两个剪枝规则进行高效剪枝,减少了离群检测时数据点之间距离计算的次数。理论分析和实验结果证明了算法的可行性和效率。

同期刊论文项目
同项目期刊论文