位置:成果数据库 > 期刊 > 期刊详情页
基于共享的MapReduce多查询优化技术
  • ISSN号:1001-3695
  • 期刊名称:计算机应用研究
  • 时间:2013.5.15
  • 页码:1405-1409
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]西北工业大学计算机学院,西安710072
  • 相关基金:基金项目:国家自然科学基金资助项目(61033007);国家“973”重点基础发展规划基金资助项目(2012CB316203);国家“863”高技术研究发展基金资助项目(2012AA011004);西北工业大学研究生创业种子基金资助项目(7-2012128)
  • 相关项目:数据密集型计算环境下的数据管理方法与技术
中文摘要:

为解决MapReduce处理多个查询时效率低下的问题,提出了一种基于查询共享的MapReduce查询优化方法——Shareopt优化。通过分析所有查询的操作模式,找出其中共享的子查询部分,并根据子查询的执行顺序构造执行计划有向图(DAG),最终确定一组查询的整体执行计划。通过与Hive和Pig的对比,验证了该方法能够在保证准确性的情况下有效地减少执行步数,提高查询执行的效率。

英文摘要:

To improve the multi-query processing efficiency for MapReduce, this paper proposed a multi-query optimization approach based on sub-query sharing and merging. Firstly, it analyzed the patterns of all the queries and identified those sub- queries which had sharing opportunities and could be merged. Next it constructed a directed aeyclic graph (DAG) according to the sub-queries execution sequences. It added the non-sharing sub-queries to the DAG graph and finally got the overall exe- cution plan for the queries. Experiment results show that the approach can effectively eliminate unnecessary re-computation and save query execution time.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049