位置:成果数据库 > 期刊 > 期刊详情页
基于粗约简和网格的离群点检测
  • ISSN号:1002-8331
  • 期刊名称:计算机工程与应用
  • 时间:2014.5
  • 页码:133-137+180
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华中师范大学计算机学院,武汉430079
  • 相关基金:国家自然科学基金(No.61170017,No.61370108)
  • 相关项目:高性能拓扑感知应用层组播模型构建及性能优化问题的研究
作者: 王敬华|金鹏|
中文摘要:

为解决现有高维海量数据离群点挖掘在时间与空间效率上的不足,提出了一种基于粗约简和网格的离群点检测算法RRGOD。算法在基于密度的离群点检测算法LOF的基础上,结合粗糙集理论特点,引入属性权值概念,淘汰属性权值低于重要度阈值的属性降低维度,从而减少了进行聚类的计算量。在网格聚类阶段,对传统的网格划分方法进行改进,引入属性维半径向量概念,提出了一种可变网格划分方法,根据数据集特点自适应地划分网格空间。在真实数据集和仿真数据集上进行了实验。结果表明,该算法在进行离群点检测时能在保持足够精确度的同时,检测效率有显著的改善。

英文摘要:

In order to solve the existing insufficiency of mining outliers in time and space efficiency in high dimensional and massive data, this paper proposes a grid based on rough reduction and outlier detection algorithms RRGOD. Based on the density-based outlier detection algorithm LOF, it combines the characteristics of rough set theory, introduces the concept of the value of property rights, and reduces dimensions by eliminating the values of property right below the threshold,thereby reducing the amount of calculation clustering. In the grid clustering stage, the traditional meshing method is improved,introduces the concept of property dimensional radius vector, and a variable meshing method is presented. Meshing space is divided adaptively according to the characteristics of the data set. Experiment is done on real data sets and simulation data sets. The results show that during outlier detection the algorithm can maintain sufficient accuracy while a significant detecting efficiency is improved.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机工程与应用》
  • 北大核心期刊(2014版)
  • 主管单位:中国电子科技集团公司
  • 主办单位:华北计算技术研究所
  • 主编:怀进鹏
  • 地址:北京市海淀区北四环中路211号北京619信箱26分箱
  • 邮编:100083
  • 邮箱:ceaj@vip.163.com
  • 电话:
  • 国际标准刊号:ISSN:1002-8331
  • 国内统一刊号:ISSN:11-2127/TP
  • 邮发代号:82-605
  • 获奖情况:
  • 1. 2012年首批获得中国学术文献评价中心发布的 “...,2. 2001年获得新闻出版署“中国期刊方阵双效期刊”,3. 2008年首批入选国家科技部“中国精品科技期刊...,4.2003年-2011年连续获得工业和信息化部期刊最高...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:97887