位置:成果数据库 > 期刊 > 期刊详情页
基于多级位图目录的支持度计算问题研究
  • ISSN号:1000-5781
  • 期刊名称:《系统工程学报》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]天津大学管理学院,天津300072
  • 相关基金:国家自然科学基金资助项目(70571057).
中文摘要:

频繁模式在许多数据挖掘任务中都起着十分关键的作用,现有的支持度计算方法存在着效率不高、I/O和时间开销较高等缺点.本文以提出了一种用多级位图目录来实现项集支持度计算的方法,给出了多级位图目录的结构和相应算法;对位图的组织采用了一种可伸缩的动态分块管理机制,在此基础上对位图进行了编码压缩(即以一个短码来替代一个长向量块),在较大程度上减少了对磁盘及主存空间的需求;最后,在实验的基础上对算法的性能进行了分析.基于多级位图目录的项集支持度计算算法具有结构简单、空间和时间开销小等优点.

英文摘要:

Frequent patterns play an essential role in many data mining tasks. Most of the existing supports counting technologies require high I/O costs and computing overheads. A new method based on multi - level bitmap catalogue for itemsets supports determining is proposed. A detailed description of the structure of multi-level bitmap catalogue as well as algorithms using multi-level bitmap catalogue to implement supports counting is given. And a dynamic bitmap management mechanism found on block-partitioned is employed, and hence every block is encoded as a shorter symbol to reduce the disk and main memory requirements. Experimental and analytical results are presented in the end. The supports counting algorithms based on multi-level bitmap catalogue introduced in this paper has some advantages, such as simple structure, low overhead of space and time, and so on.

同期刊论文项目
期刊论文 34 会议论文 6 获奖 2
同项目期刊论文
期刊信息
  • 《系统工程学报》
  • 北大核心期刊(2014版)
  • 主管单位:中国科协
  • 主办单位:中国系统工程学会
  • 主编:唐万生
  • 地址:天津市卫津路92号
  • 邮编:300072
  • 邮箱:jsetju@263.net
  • 电话:022-27403197
  • 国际标准刊号:ISSN:1000-5781
  • 国内统一刊号:ISSN:12-1141/O1
  • 邮发代号:6-95
  • 获奖情况:
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:14850