位置:成果数据库 > 期刊 > 期刊详情页
挖掘滑动窗口中的数据流频繁项算法
  • ISSN号:1000-1220
  • 期刊名称:小型微型计算机系统
  • 时间:2012
  • 页码:940-949
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江苏省信息融合软件工程技术研发中心,江苏江阴214405, [2]江阴职业技术学院计算机科学系,江苏江阴214405, [3]扬州大学计算机科学与工程系,江苏扬州225009, [4]南京大学南京大学计算机软件新技术国家重点实验室,南京210093
  • 相关基金:国家自然科学基金项目(61070047,61003180)资助; 江苏省自然科学基金项目(BK2008206,BK2010311)资助; 江苏省教育厅自然科学基金项目(09KJB20013)资助; 江苏省信息融合软件工程技术研发中心基金项目(SR-2011-05)资助; 江苏省普通高校研究生科研创新计划项目(CX08B_098Z)资助
  • 相关项目:蚁群优化算法的搜索偏离性研究
中文摘要:

滑动窗口是一种对最近一段时间内的数据进行挖掘的有效的技术,本文提出一种基于滑动窗口的流数据频繁项挖掘算法.算法采用了链表队列策略大大简化了算法,提高了挖掘的效率.对于给定的阈值S、误差ε和窗口长度n,算法可以检测在窗口内频度超过Sn的数据流频繁项,且使误差在εn以内.算法的空间复杂度为O(ε-1),对每个数据项的处理和查询时间均为O(1).在此基础上,我们还将该算法进行了扩展,可以通过参数的变化得到不同的流数据频繁项挖掘算法,使得算法的时间和空间复杂度之间得到调节.通过大量的实验证明,本文算法比其它类似算法具有更好的精度以及时间和空间效率.

英文摘要:

The sliding window is an effective approach to mine frequent data itmes in the recent period of time.proposed an algorithm for mining frequent items in a stream based on sliding window.The algorithm adopts linked queue strategy which greatly improves the efficiency of the algorithm.Given a threshold S,an error bound ε and the length of the sliding window n,our algorithm can determinately detect the data items within the current window whose frequncy exceeds Sn with an error less than εn using O(ε-1) memory space,and the processing time for each data item and the query time are both O(1).Based on this algorithm,we have proposed a general framework for mining frequent items in data stream based on sliding window.Under this framework,different algorithms can be constructed by changing the parameters which could adjust the time complexity and space cost of the algorithm.Through extensive experiments,we show that our algorithm outperforms other methods in terms of the accuracy,memory requirement,and processing speed.

同期刊论文项目
期刊论文 37 会议论文 11
期刊论文 62 会议论文 11 获奖 6
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212