东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于顺序读取的分布式top-k查询算法

ISSN号：1001-9081
期刊名称：《计算机应用》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]中国矿业大学徐州计算机科学与技术学院,江苏徐州221116
相关基金：国家自然科学基金资助项目（60970032）;江苏省自然科学基金资助项目（BK2007035）.

关键词：分布式, 数据存储, 数据划分, 顺序读取, 内存有限, distributed, data storage, data partitioning, sorted access, limited memory

中文摘要：

top-k查询是一种被广泛应用的操作，通过把已有top-k算法作为分析和研究的基础，根据现有算法所存在的不足提出自己的解决方案。提出SRTA（ Sequential-Read Threshold Algorithm），相比NRA算法对数据的存储进行了重新的规划，创建一个新的表将内存上的开销转换到较廉价的外存开销，只需顺序读取就可以进行有效的top-k查询，同时将表进行了划分，在并行处理的情况下更能提高程序的效率，能够很好地运行在内存有限的环境中。在SRTA基础上提出的DSRTA（Distributed Sequential-Read Threshold Algorithm），适用于分布式环境中。 DSRTA先采用ID划分的方式把原有数据集划分为多个子空间，然后再进行数据规划，发挥分布式的性能优势，进一步提高了SRTA的查询效率。

英文摘要：

Top-k query is a widely used operation. This paper took the existing algorithms as the basis of analysis and research, and put forward solutions to solving the problems of the existing algorithms. Compared with the NRA （ No Random Access） algorithm, the SRTA （ Sequential-Read Threshold Algorithm） which proposed in this paper replanted the data storage mode, which created a new table to switch the memory overhead to the cheaper external memory overhead, so just sorted access was also able to do efficient top-k query. Meanwhile, the table was divided, which made the algorithm more efficient and smoother even with limited memory, in the case of parallel processing. DSRTA （ Distributed SRTA） algorithm applies to the distributed environment, which is designed on the basis of SRTA. The original data set was divided into more than one spaces in the way of ID division by DSRTA, and then replanted the data storage mode. By taking advantages of the distributed system performance, the query efficiency of SRTA was further improved.

同期刊论文项目

基于程序切片和遗传算法的软件测试数据生成技术

期刊论文 27 会议论文 11 专利 4

同项目期刊论文

一种基于动态依赖关系的类集成测试方法

改进的量子遗传算法及其在测试数据生成中的应用

Design of class integration test order based on coupling measures

Analysis on parameters in an improved Quantum Genetic Algorithm

基于变量作用域的数据流分析

多路径覆盖测试数据生成适应度函数设计方法

一种包含异常处理结构的面向对象切片方法

面向对象程序的异常传播分析方法

一个程序静态分析与可视化工具

一种基于耦合度量的类间集成测试序的确定方法

基于遗传算法的动态可变参数的测试数据自动生成工具

一种新的数据流覆盖测试数据进化生成方法

一种改进的程序可达基路径生成方法

Analysis of Object-Oriented Programs with Exception-Handling Constructs

不可达基路径的静态检测方法

基于复杂系统遗传算法的多路径覆盖测试用例生成方法

软件故障定位技术进展

Test Data Generation Approach for Basis Path Coverage

Infeasible Basis Paths Detection of Program with Exception-Handling Constructs

基于动态切片和关联分析的错误定位方法

空指针异常的自动故障定位方法

基于参数-值替换的错误定位方法

基于空间密度的群以噪声发现聚类算法研究

基于贝叶斯的软件错误定位方法

路径测试中基本路径集自动生成方法的研究

一种包含异常处理的粗粒度切片方法

期刊信息

《计算机应用》
北大核心期刊（2011版）

主管单位:四川省科学技术协会
主办单位:四川省计算机学会中国科学院成都分院
主编：张景中
地址：成都市人民南路四段九号科分院计算所
邮编：610041
邮箱：xzh@joca.cn
电话：028-85224283

国际标准刊号：ISSN：1001-9081
国内统一刊号：ISSN：51-1307/TP
邮发代号:62-110

获奖情况:
全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:53679