位置:成果数据库 > 期刊 > 期刊详情页
利用子空间划分的局部离群数据挖掘算法
  • ISSN号:1000-1220
  • 期刊名称:小型微型计算机系统
  • 时间:2011.8.8
  • 页码:1628-1632
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]太原科技大学计算机科学与技术学院,太原030024
  • 相关基金:国家自然科学基金项目(61073145)资助; 山西省自然科学基金项目(2010011021-2)资助; 山西省回国留学人员科研项目(2009-77)资助
  • 相关项目:面向LAMOST天文光谱特征线的数据挖掘方法研究
中文摘要:

目前大多数局部离群数据挖掘算法需人为事先设置参数或阈值,且难以应用到高维数据集.给出一种新的局部离群数据挖掘算法PSO-SPLOF,该算法首先将数据集划分为互不相交的子空间,利用偏斜度判断子空间划分的优劣,并采用微粒群算法搜索最优划分子空间集;其次针对每个最优划分子空间,计算其数据对象的局部离群因子SPLOF值,并用SPLOF值来度量数据对象的局部偏离程度.最后采用离散化的天体光谱数据作为数据集,实验验证了PSO-SPLOF算法具有受人为因素影响小、伸缩性强和运算效率高等优点.

英文摘要:

Most local outlier mining algorithms depend on the parameters that user inputs,and it is difficult to apply to high-dimensional data set.In this paper,a novel algorithm(PSO-SPLOF) of local outlier mining is presented.Firstly,data set is divided into the disjoint subspaces,merits of the subspace partition is measured by skew of partition,and the best partition of the subspaces is searched by using the optimal particle swarm algorithm.Secondly,the local outlier factor(SPLOF) value of data objects is computed for each subspace in the best partition,and local outliers is measured by its SPLOF value.Finally,experimental results show that the PSO-SPLOF algorithm is not affected by man-made factors,and has strong scalability and high efficiency by taking star spectral data as data set.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212