位置:成果数据库 > 期刊 > 期刊详情页
一种基于Actor模型的弹性可伸缩的流处理框架
  • ISSN号:1000-1239
  • 期刊名称:《计算机研究与发展》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]高可信软件技术教育部重点实验室(北京大学),北京100871, [2]北京大学(天津滨海)新一代信息技术研究院,天津300450
  • 相关基金:国家“八六三”高技术研究发展计划基金项目(2015AA01A202); 国家“九七三”重点基础研究计划基金项目(2011CB302604); 国家自然科学基金项目(61272154,61421091); 百度云服务开放平台示范项目(2015年)
中文摘要:

流处理是一种重要的大数据应用模式,在金融、广告、物联网、社交网络等众多领域得到了广泛应用.在流处理场景中,流数据的产生速度往往变化剧烈且不容易预测.这时,如果数据流量峰值超过处理系统的承载能力,可能使得系统运行缓慢甚至崩溃,导致处理作业失效;如果为了应对数据流量峰值而过度配置资源,则可能在系统轻载时产生不必要的浪费.为了解决流处理中负载和资源的匹配问题,流处理系统应该具有弹性可伸缩的能力,一方面以高效的方式组织运算资源;另一方面能根据数据流量的实时变化自动地调整资源使用量.然而,现有的流处理框架对于弹性可伸缩的支持尚很初步.介绍了一种基于Actor模型的弹性可伸缩的流处理框架eSault.eSault首先基于Actor模型将批量的处理单元进行分层管理,通过2层路由机制实现了对伸缩性的支持;在此基础上,设计一个基于数据处理延迟的过载判断算法和基于数据处理速度的轻载判断算法来指导系统对资源的有效使用,进而实现弹性可伸缩的流处理.实验结果表明:eSault具有较好的性能,而且能够很好地实现弹性可伸缩.

英文摘要:

In the era of big data,stream processing has been widely applied in financial industry,advertising,Internet of things,social networks and many other fields.In streaming scenarios,the generation speed of stream data tends to be fluctuant and difficult to predict.If the streaming peak is larger than system capacity,the system may run slowly or even crash,which leads to job failure.If excessive resources are provided in case of streaming peak,there can be unnecessary waste under light load.In order to solve the matching problem between stream processing load and resources,stream processing system should be elastically scalable,which means that provided resources can be adjusted automatically according to the real-time change of stream flow.Although some researches have made great progress in stream processing,it is still an open problem that how to design an elastic scalable system.This paper introduces eSault,an elastically scalable stream processing framework based on Actor model.eSault firstly manages the processing units stratified hierarchically based on Actor model,and realizes scalability with two-layer routing mechanism.On this basis,eSault proposes an overload judgment algorithm based on data processing delay and light load judgment algorithm based on the data processing speed to efficiently allocate the resources,and achieve elastically scalable stream processing.Experiments show that eSault has good performance,and can achieve flexible scalability well.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349