东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于分配适应度的Spark渐进填充分区映射算法

ISSN号：1000-436X
期刊名称：《通信学报》
时间：0
分类：TP393.09[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]新疆大学软件学院,新疆乌鲁木齐830008, [2]新疆财经大学统计与信息学院,新疆乌鲁木齐830012
相关基金：国家自然科学基金资助项目(No.61262088,No.61462079,No.61562078,No.61363083,No.61562086);新疆维吾尔自治区自然科学基金资助项目(No.2017D01A20);新疆维吾尔自治区高校科研计划基金资助项目(No.XJED2016S106);新疆财经大学科研博士启动基金资助项目(No.2015BS007)

作者：卞琛[1], 于炯[1], 修位蓉[1], 廖彬[2], 英昌甜[1], 钱育蓉[1]

关键词：并行计算, SPARK, 渐进填充, 分区映射, 分配适应度, parallel computing, Spark, progressive filling, partitioning and mapping, allocation fitness degree

中文摘要：

分析Spark的作业执行机制，建立了执行效率模型和Shuffle过程模型，给出了分配适应度（AFD,allocationfitnessdegree）的定义，提出了算法的优化目标。根据模型的相关定义求解，设计了渐进填充分区映射算法（PFPM,progressivefillingpartitioningandmappingalgorithm），通过扩展式分区和渐进填充映射，建立适应Reducer计算能力的数据分配方案，有效缩减Shuffle过程的同步延时，提高集群计算效率。实验表明该算法提高了Shuffle过程数据分配的合理性，优化了并行计算框架Spark的作业执行效率。

英文摘要：

The job execution mechanism of Spark was analyzed,task efficiency model and Shuffle model were established,then allocation fitness degree(AFD)was defined and the optimization goal was put forward.On the basis of the model definition,the progressive filling partitioning and mapping algorithm(PFPM)was proposed.PFPM established the data distribution scheme adapting Reducers'computing ability to decrease synchronous latency during Shuffle process and increase cluster the computing efficiency.The experiments demonstrate that PFPM could improve the rationality of workload distribution in Shuffle and optimize the execution efficiency of Spark.

同期刊论文项目

云计算环境下海量遥感数据的节能存储研究

期刊论文 26

云计算环境下应用数据层节能计算研究

期刊论文 44

社交网络环境下基于协同过滤的上下文感知推荐系统研究

期刊论文 23

多Slot环境下的MapReduce能耗模型及优化研究

期刊论文 10

基于内存计算的遥感数据高效并行和任务调度研究

期刊论文 15

同项目期刊论文

温度感知的MapReduce节能任务调度策略

适应节能与异构环境的MapReduce数据布局策略

基于Spark的ItemBased推荐算法性能优化

大数据流式计算环境下的阈值调控节能策略

SparkDAG优化MapReduce协同过滤算法

基于Spark的MapReduce相似度计算效率优化

大数据流式计算环境下的内存节能策略

基于聚类层次模型的视频推荐算法

基于GraphX的传球网络构建及分析研究

基于分布式计算的遥感图像水体识别研究

大数据流式计算环境下的内存节能策略

基于聚类层次模型的视频推荐算法

Haar整数频域变换耦合动态引力模型的加密算法

嵌入式超高速数字图像实时存储系统设计

基于内存云的大块数据对象并行存取策略

适应异构集群的Mesos多资源调度DRF增强算法

面向内存云的数据块索引方法

基于复杂网络节点重要性的链路预测算法

基于迭代填充的内存计算框架分区映射算法

分布式文件系统数据块聚类存储节能策略

面向内存云的协调器选举策略

结构化查询语言动态功耗解析及建模

内存云分级存储架构下的数据迁移模型

融合评论分析和隐语义模型的视频推荐算法

内存计算框架局部数据优先拉取策略

云环境下能耗感知的虚拟机动态迁移策略研究

融合可信度和时效标签的商品推荐算法

结合评分可信度和动态时间加权的推荐算法

基于LDA主题模型的移动应用相似度构建方法

基于负载感知的数据流动态负载均衡策略

基于标签匹配的协同过滤推荐算法研究

云环境基于多工作流的任务调度节能算法的研究

一种分区BP人工神经网络图像差值算法

一种多 DAG 任务共享异构资源调度的费用优化方法

温度感知的MapReduce节能任务调度策略

适应节能与异构环境的MapReduce数据布局策略

云计算环境下多有向无环图工作流的节能调度算法

一种适应节能的云存储系统元数据动态建模与管理方法

P2P下基于RSA密码机制和门限秘密共享的信誉管理方案

新疆典型荒漠草地的高光谱特征提取和分析研究

融合奇异性和扩散过程的协同过滤模型

评分可信度条件下的协同过滤模型

基于Spark的ItemBased推荐算法性能优化

SparkDAG优化MapReduce协同过滤算法

基于Spark的MapReduce相似度计算效率优化

大数据流式计算环境下的内存节能策略

基于聚类层次模型的视频推荐算法

基于GraphX的传球网络构建及分析研究

基于信任模型填充的协同过滤推荐模型

新疆阜康荒漠植被指数特征和时空过程分析

基于内存云架构的带宽负载均衡算法

基于可靠性的云工作流调度策略

一种面向低延迟的内存HDFS数据存储策略

基于内存云的大块数据对象并行存取策略

适应异构集群的Mesos多资源调度DRF增强算法

面向内存云的数据块索引方法

基于复杂网络节点重要性的链路预测算法

基于迭代填充的内存计算框架分区映射算法

分布式文件系统数据块聚类存储节能策略

面向内存云的协调器选举策略

结构化查询语言动态功耗解析及建模

内存云分级存储架构下的数据迁移模型

融合评论分析和隐语义模型的视频推荐算法

内存计算框架局部数据优先拉取策略

云环境下能耗感知的虚拟机动态迁移策略研究

融合可信度和时效标签的商品推荐算法

结合评分可信度和动态时间加权的推荐算法

基于LDA主题模型的移动应用相似度构建方法

基于负载感知的数据流动态负载均衡策略

基于标签匹配的协同过滤推荐算法研究

基于快速构建模板的购物信息抽取方法

并行计算框架Spark的自适应缓存管理策略

基于SpringMVC和Hibernate的企业人事管理系统

云环境基于多工作流的任务调度节能算法的研究

一种分区BP人工神经网络图像差值算法

An Operator on Ascent Sequences

一种多 DAG 任务共享异构资源调度的费用优化方法

大数据流式计算环境下的阈值调控节能策略

大数据流式计算环境下的内存节能策略

基于聚类层次模型的视频推荐算法

基于内存云的大块数据对象并行存取策略

适应异构集群的Mesos多资源调度DRF增强算法

基于迭代填充的内存计算框架分区映射算法

面向内存云的协调器选举策略

内存计算框架局部数据优先拉取策略

融合可信度和时效标签的商品推荐算法

结合评分可信度和动态时间加权的推荐算法

基于LDA主题模型的移动应用相似度构建方法

基于负载感知的数据流动态负载均衡策略

基于标签匹配的协同过滤推荐算法研究

基于SpringMVC和Hibernate的企业人事管理系统

大数据流式计算环境下的阈值调控节能策略

大数据流式计算环境下的内存节能策略

基于聚类层次模型的视频推荐算法

基于内存云的大块数据对象并行存取策略

适应异构集群的Mesos多资源调度DRF增强算法

面向内存云的数据块索引方法

基于复杂网络节点重要性的链路预测算法

基于迭代填充的内存计算框架分区映射算法

分布式文件系统数据块聚类存储节能策略

面向内存云的协调器选举策略

结构化查询语言动态功耗解析及建模

内存云分级存储架构下的数据迁移模型

融合评论分析和隐语义模型的视频推荐算法

内存计算框架局部数据优先拉取策略

融合可信度和时效标签的商品推荐算法

结合评分可信度和动态时间加权的推荐算法

基于LDA主题模型的移动应用相似度构建方法

基于负载感知的数据流动态负载均衡策略

基于标签匹配的协同过滤推荐算法研究

并行计算框架Spark的自适应缓存管理策略

云环境基于多工作流的任务调度节能算法的研究

一种分区BP人工神经网络图像差值算法

期刊信息

《通信学报》
中国科技核心期刊

主管单位:中国科学技术协会
主办单位:中国通信学会
主编：杨义先
地址：北京市丰台区成寿寺4路11号邮电出版大厦8层
邮编：100078
邮箱：
电话：010-81055478 81055481

国际标准刊号：ISSN：1000-436X
国内统一刊号：ISSN：11-2102/TN
邮发代号:2-676

获奖情况:
信息产业部通信科技期刊优秀期刊二等奖

国内外数据库收录:
荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:25019