位置:成果数据库 > 期刊 > 期刊详情页
DBCC-Join:一种新的高速缓存敏感的磁盘连接算法
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001, [2]哈尔滨工业大学基础与交叉科学研究院高性能计算中心,哈尔滨150001
  • 相关基金:国家“九七三”重点基础研究发展规划项目基金(2006CB303005); 国家自然科学基金(60903016 60533110 60773063); 新世纪优秀人才支持计划(NCET-05-0333); 黑龙江省教育厅科学技术研究项目(11531276); NSFC-RGC of China(60831160525)资助
中文摘要:

随着CPU和内存的性能差距越来越大,系统设计者在CPU寄存器和内存之间插入高速缓存来弥补这个差距.高速缓存的数据存取速度远高于内存,所以数据库操作要获得更好的性能就必须考虑充分利用高速缓存.基于磁盘的连接操作是一种常用并且耗时的数据库查询操作,可是大多数传统的连接算法在设计时都没有考虑高速缓存的使用,从而使得这些连接算法无法充分利用CPU的能力.文中分析了传统的连接算法在高速缓存利用方面的问题,并且提出了一种新的可以充分利用高速缓存的磁盘连接算法DBCC-Join.连接位置索引对表JPIPT是用到的数据结构,说明了每个连接结果元组在各自表中的位置索引对.DBCC-Join的执行包括两个阶段:JPIPT构建阶段和结果输出阶段.JPIPT构建阶段对列存储化的连接属性执行高速缓存敏感的算法来构建连接位置索引对表.利用获得的JPIPT,结果输出阶段只需要对数据表执行一遍顺序扫描就可以获得结果.该文是第一篇提出利用高速缓存的磁盘连接算法的文章.实验表明,和传统磁盘连接算法相比,DBCC-Join算法可以获得一个数量级的加速比.

英文摘要:

System designers exploit cache to make up for performance gap between CPU and main memory.Since data access speed of cache is much faster than that of memory,it is important for database operations to take maximum advantage of cache to obtain higher performance.Disk-based join operation is a common but time-consuming database operation.Unfortunately,most of traditional join algorithms do not take cache into consideration.This paper analyzes low cache utilization problem in traditional join algorithms and proposes a disk-based cache-conscious join algorithm DBCC-Join.Join positional index pair table(JPIPT) is a data structure which specifies the positional index pairs of join tuples in each table.The execution of DBCC-Join consists of two stages:JPIPT construction stage and result output stage.JPIPT construction stage performs cache-conscious construction algorithm on join attributes which are kept in column-oriented model,to obtain join positional index pair table of join results.The obtained JPIPT is used in result output stage to retrieve results in a one-pass sequential scan on each table.To the best of our knowledge,this paper is the first to exploit cache to improve performance of disk-based join algorithm.Experimental results show that compared to traditional join algorithms,DBCC-Join can be improved by a factor of an order of magnitude.

同期刊论文项目
期刊论文 44 会议论文 7
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433