东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

大数据环境下支持概率数据范围查询索引的研究

ISSN号：0254-4164
期刊名称：计算机学报
时间：0
页码：-
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：东北大学信息科学与工程学院,沈阳110004
相关基金：国家“九七三”重点基础研究发展规划项目基金（2012CB316201）、国家自然科学基金（61272178,61572122,61173031,61129002,61532021,U1401256）、国家优秀青年科学基金（61322208）资助.
相关项目：社会网络中多元约束条件下的隐私保护关键技术研究

关键词：大数据, 概率数据, 索引, 概率概要信息, 多分辨率网格, big-data, range query, index, summary, multi-resolution grid

中文摘要：

随着数据规模的不断增长,大数据管理具有重要意义.在众多数学模型中,因为概率模型可以将海量数据抽象成少量概率数据,所以它非常适合管理大数据.因此,研究大数据环境下的概率数据管理具有重要意义.作为一种经典查询,基于概率数据的范围查询已被深入研究.然而,当前研究成果不适合在大数据环境下使用.其根本原因是这些索引的更新代价较大.该文提出了索引HGD-Tree解决这一问题.首先,该文提出了一系列算法降低新增数据的处理代价.它可以保证树结构平衡的前提下快速地执行插入、删除、更新等操作.其次,该文提出了一种基于划分的方法构建概率对象的概要信息.它可以根据概率密度函数的特点自适应地执行划分.此外,由于作者提出的概要是基于比特向量,上述策略可以保证索引以较低空间代价管理概率数据.最后,该文提出了一种基于位运算的方法访问HGD-Tree.它可以用少量的位运算执行过滤操作.大量的实验验证了算法的有效性.

英文摘要：

With the increasing of data scale, big data management is great significant. Underlying the popular mathematical models, probabilistic model is suitable for big data management since it could compress volume of data into a few probabilistic data. Therefore, it is significant for studying the problem of probabilistic data management over big data environment. As a classic query, range query over probabilistic data has been fully studied. However, the state of art efforts are not suitable since they all suffer from highly updating cost. In this paper, we propose a novel index named HGD-Tree for solving this problem. First of all, we propose a group of novel strategies for handling newly arrival objects. In this way, we could efficiently apply the insertion, deletion, and updating on the premise of balancing tree structure. In addition, we propose a novel partition-based structure to approach the probability density function of object, where the structure could self-adjust the partition resolution so as to cater for the underlying of uncertain data. Besides, our proposed structure is expressed by a few bit vectors. The above two strategies guarantee low space cost of the proposed index. Last but not least, we propose a novel algorithm for supporting the range query which could effectively apply the analysis and extensive experimental results algorithms. pruning under few bitwise operations. Theoretical demonstrate the effectiveness of the proposed

同期刊论文项目

面向物联网搜索的隐私保护理论和关键技术

期刊论文 16

数据库理论与系统

期刊论文 10

社会网络中多元约束条件下的隐私保护关键技术研究

期刊论文 25 会议论文 13 获奖 3

面向多源信息的实体分析与识别技术

期刊论文 31 会议论文 20 获奖 2

溯源驱动的弱可用性轨迹数据管理关键技术

期刊论文 5

支持跨模型多源数据的复制检测关键技术研究

期刊论文 14

同项目期刊论文

基于图自同构的K-Secure社会网络隐私保护方法

防止路径攻击的加权社会网络匿名化技术

基于 Grid 网格划分的改进路网最短路径查询

一种支持约束关系的高效的行程规划算法

基于属性权重的实体解析技术

障碍空间中保持位置隐私的最近邻查询方法

社会网络数据发布隐私保护技术综述

基于位置的社会网路的K-连接安全分组匿名方法

基于Grid网格划分的改进路网最短路径查询

路网环境下基于位置服务的隐私保护方法

增量的动态社会网络匿名化技术

Obtaining k-obfuscation for profile privacy in social network

A secure K-automorphism Privacy Preserving Approach with High Data Utility in Social Networks

基于外存后缀树的top-k局部比对算法

基于时间约束的人气最优路径搜索

支持动态图数据的子图查询方法

基于变化的服务演化一致性判定

一种支持约束关系的高效的行程规划算法

海洋多模态数据世系原型系统

基于属性权重的实体解析技术

基于缓存技术的路网最短路径查询

障碍空间中保持位置隐私的最近邻查询方法

社会网络数据发布隐私保护技术综述

路网环境下基于位置服务的隐私保护方法

增量的动态社会网络匿名化技术

面向压缩生物基因数据的高效的查询方法

一种空间高效的多核并行近似子串匹配方法

Approximate Continuous Top-k Query over Sliding Window

Memory-Aware BWT by Segmenting Sequences to Support Subsequence Search

基于变化的服务演化一致性判定

最小化解释Why-Not问题

一种支持约束关系的高效的行程规划算法

Detecting Copy Directions among Programs Using Extreme Learning Machines

一种空间高效的多核并行近似子串匹配算法

海洋多模态数据世系原型系统

基于属性权重的实体解析技术

基于缓存技术的路网最短路径查询

Negative Factor: Improving Regular-Expression Matching in Strings

障碍空间中保持位置隐私的最近邻查询方法

路网环境下基于位置服务的隐私保护方法

增量的动态社会网络匿名化技术

基于外存后缀树的top-k局部比对算法

基于时间约束的人气最优路径搜索

一种空间高效的多核并行近似子串匹配方法

海洋多模态数据世系原型系统

基于缓存技术的路网最短路径查询

路网环境下基于位置服务的隐私保护方法

基于外存后缀树的top-k局部比对算法

基于时间约束的人气最优路径搜索

面向压缩生物基因数据的高效的查询方法

一种空间高效的多核并行近似子串匹配方法

Approximate Continuous Top-k Query over Sliding Window

基于外存后缀树的top-k局部比对算法

基于时间约束的人气最优路径搜索

面向压缩生物基因数据的高效的查询方法

Approximate Continuous Top-k Query over Sliding Window

面向MAX/MIN优化的SQL Window函数处理

基于外存后缀树的top-k局部比对算法

基于时间约束的人气最优路径搜索

面向双层传感网的隐私保护k-NN查询处理协议

统计粗糙集

群智感知激励机制研究综述

面向压缩生物基因数据的高效的查询方法

基于函数依赖与条件约束的数据修复方法

面向海量低质手机轨迹数据的重要位置发现

Approximate Continuous Top-k Query over Sliding Window

云存储完整性验证密码学技术研究进展

基于隐语义模型的中医在线辅助诊疗系统

云服务中数据完整性验证技术综述

ALFHJ：一种面向众核协处理器的自适应无锁哈希连接算法

基于中国剩余定理的智能电表身份认证方案

期刊信息

《计算机学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国计算机学会中国科学院计算技术研究所
主编：孙凝晖
地址：北京中关村科学院南路6号
邮编：100190
邮箱：cjc@ict.ac.cn
电话：010-62620695

国际标准刊号：ISSN：0254-4164
国内统一刊号：ISSN：11-1826/TP
邮发代号:2-833

获奖情况:
中国期刊方阵“双效”期刊

国内外数据库收录:
美国数学评论（网络版）,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:48433