位置:成果数据库 > 期刊 > 期刊详情页
基于空间自相关性和模糊集的空间数据噪声点检测算法
  • ISSN号:1000-386X
  • 期刊名称:计算机应用与软件
  • 时间:0
  • 页码:-
  • 分类:TP315[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:郑州轻工业学院计算机与通信工程学院,河南郑州450002
  • 相关基金:国家自然科学基金项目(61201447); 河南省科技攻关项目(122102210492); 河南省教育厅科学技术研究重点项目(13A520368,13A520367)
  • 相关项目:云计算Hadoop框架中高效迭代机制的研究
中文摘要:

大数据时代数据纷繁复杂,同时在数据挖掘过程中数据质量又至关重要,数据质量的高低将直接影响数据挖掘结果的好坏,但现实中数据缺失和噪声数据的现象在所难免。针对上述问题,通过引入空间对象的自相关性理论和模糊集理论,提出一种基于空间自相关性和模糊集的空间数据噪声点检测算法。该算法首先运用邻域对象的空间自相关性理论,计算出特定对象与邻域内其他对象的距离,进而将距离以模糊隶属度的概念予以表达,最后通过与该属性的置信水平进行比较,以此来判定噪声数据。理论分析和实验对比结果均表明,该算法对于处理空间数据噪声点问题是有效可行的。

英文摘要:

Data shows more complex characteristics in the era of big data. Meanwhile,the quality of data is crucial in the process of data mining and will directly affect the results of data mining,but the phenomena of data missing and noise data are inevitable in reality. Aiming at the above problems,by introducing the theory of spatial auto-correlation of spatial object and the theory of fuzzy set we propose a spatial data noise point detection algorithm. First,the algorithm calculates the distance between the specific object and other objects within its neighbourhood by using spatial auto-correlation theory of neighbourhood object. Then it expresses the distance by the concept of fuzzy membership degree. Finally,it determines whether there is a noise data by comparing with the confidence level of the attribute. Theoretical analysis and experimental comparison results all show that this method is effective and feasible in handling the problem of spatial data noise point.

同期刊论文项目
期刊论文 44 会议论文 6 获奖 8
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463