东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

集群数据库系统的日志复制和故障恢复

ISSN号：1000-9825
期刊名称：《软件学报》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]华东师范大学计算机科学与软件工程学院,上海200062, [2]广西可信软件重点实验室桂林电子科技大学,广西桂林541004
相关基金：国家高技术研究发展计划（863）（2015AA015307）;国家自然科学基金（61332006,61432006,61672232）;广西可信软件重点实验室研究课题（kx201602）

关键词：日志复制, 故障恢复, 一致性, 可用性, 数据库系统, log replication, recovery, consistency, availability, database system

中文摘要：

互联网、社交、购物、金融等各类应用直接面临海量用户的高并发访问,传统的单点数据库逐渐成为这些应用系统的瓶颈,而众多互联网应用能够良好运行的主要原因是使用了基于集群环境的数据管理系统作支撑.与传统数据库系统相比,基于集群环境的数据库系统具有更好的扩展性和可用性,而日志复制是保证这些特性的核心组件.传统的主备架构的日志复制在异常情况下对未决事务日志处理不佳,导致数据副本之间存在不一致的风险.另外,分布式系统领域的一致性算法缺乏对事务一致性的处理,而且在选主时存在活锁、多主和频繁选主的问题,无法直接适用于事务日志复制.提出了一种集群环境下的事务日志复制策略和恢复机制,能够有效处理未提交日志,提供了强弱两种读一致性,并且提出一种轻量级的选主算法,可以避免出现以上的选主问题.在开源Ocean Base分布式数据库系统中实现了上述机制,并使用基准测试工具对系统进行测试,通过一系列实验验证了系统的扩展性和可用性.

英文摘要：

Many applications such as social networking, online shopping and online finance may receive highly concurrent data access from massive Internet users. In this scenario, traditional single node database systems gradually become the bottleneck of the system, and the main reason for many successful Internet applications is the use of cluster-based data management systems. Compared with traditional database systems, cluster-based distributed database systems have better scalability and availability, and log replication is one of the core components to build these features. Master-slave based log replication cannot handle the uncertain logs while failure occurs, resulting in the risk of inconsistency among different copies. Consensus algorithms cannot be directly applied to the database system due to the lack of transaction consistency model, and they also have issues in leader election with livelock, as well as double master and continuous election problem. This paper introduces a log replication strategy and corresponding recovery technique for cluster environments, which can effectively process the uncertain logs and provide two read consistency options, i.e. strong and weak consistency. A lightweightmaster election algorithm is also presented to avoid the master election issues. The algorithms are implemented in the OceanBase distributed database system and tested using benchmark tool. Experiments show that the proposed method can improve the scalability and availability.

同期刊论文项目

大数据管理系统评测基准的理论与方法

期刊论文 12

集群环境下基于内存的高性能数据管理与分析

期刊论文 39

支持可扩展事务处理的数据库日志机制及其实现

期刊论文 1

同项目期刊论文

Threshold-Based Shortest Path Query over Large Correlated Uncertain Graphs

Continuous Outlier Monitoring on Uncertain Data Streams

数据库性能测试可视化工具VisualDBBench及面向内存数据库的应用

基于增量式分区策略的MapReduce数据均衡方法

大数据环境下并行计算模型的研究进展

内存数据库的可用性综述

Constrained query of order-preserving submatrix in gene expression data

PCPIR-V：基于Spark的并行隐私保护近邻查询算法

基于上下文感知实体排序的缺失数据修复方法

高可用数据库系统中的分布式一致性协议

内存数据库事务提交的关键技术与挑战

分布式内存数据库系统的容错管理

分布式系统中Semi-Join算法的实现

分布式可扩展数据流连接算法

GraphHP：一个图迭代处理的混合平台

基于Map/Reduce的分布式数据排序算法分析

非阻塞事务型实时数据注入技术研究与实现

面向OceanBase的存储过程设计与实现

DBugHelper：分布式系统Debug协助工具

基于Raft一致性协议的高可用性实现

集群资源统一管理和调度技术综述

面向内存计算的连接算法

内存数据索引：以处理器为核心的性能优化技术

大规模分布并行计算系统容错与恢复技术

内存集群计算：交互式数据分析

LCDJ：面向内存集群计算的局部感知连接算法

图像内部Move-Copy篡改盲取证算法研究

基于改进的Adaboost算法在网络入侵检测中的应用

分布式数据流上的高性能分发策略

新型非易失存储环境下事务型数据管理技术研究

分布式大数据不一致性检测

基于可能世界模型的关系数据不一致性的修复

基于卷积神经网络的网络流量识别技术研究

分布式大数据多函数依赖冲突检测

关系数据中函数依赖检测方法

一种基于离群点检测的自动实体匹配方法

基于隐马尔可夫模型和遗传算法的地图匹配算法

一种基于Spark的多路空间连接查询处理算法

大数据分析的应用案例——投资模型的稳健性

数据管理系统评测基准：从传统数据库到新兴大数据

分布式可扩展数据流连接算法

DBugHelper：分布式系统Debug协助工具

BigDataBench：开源的大数据系统评测基准

面向高通量事务处理的事务编译技术

可扩展数据管理系统中的网络请求服务机制

实体搜索综述

大数据管理系统评测基准的挑战与研究进展

一种基于共享执行策略的间隔查询优化技术

面向图数据管理系统基准评测的知识图谱统计特征分析

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609