位置:成果数据库 > 期刊 > 期刊详情页
基于CPU-MIC异构众核环境的行星流体动力学数值模拟
  • ISSN号:1000-3266
  • 期刊名称:《数值计算与计算机应用》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院软件研究所并行软件与计算科学实验室,北京100190, [2]中国科学院软件研究所计算机科学国家重点实验室,北京100190, [3]中国科学院大学工程科学学院,北京100049, [4]中国科学院上海天文台,上海200030
  • 相关基金:基金项目:国家高技术研究发展计划(863计划)(2015AA01A302);国家自然科学基金重大研究计划集成项目(91530323);国家重点研发计划(2016YFB0200603);中国科学院信息化专项资助项目(XXH-12503-02-02-2);中国科学院前沿科学重点研究项目(QYZDB-SSW-SYS006).
中文摘要:

数值模拟是行星流体动力学研究的主要工具.本文介绍CPU-MIC异构众核平台的行星流体动力学数值模拟,计算并模拟地球外核的磁流体运动.本文在已有工作的基础上,添加了CPU-MIC异构众核环境的数值模拟支持.首先描述了CPU-MIC异构众核环境的上的数值模拟流程,然后给出了MIC上的分布式并行GMRES(m)众核解法器的实现算法.其次,实现了解法器的计算核心稀疏矩阵向量乘(SpMV)在MIC上的分布式并行算法,该SpMV实现了计算一通信重叠、数据传输一计算重叠.再次,为加速行星流体动力学方程收敛,给出了MIC上以SpMV为基本操作的分布式并行多项式预条件子.最后,提出了一些MIC众核平台的优化措施,如多线程、流存储和数据传输优化等.天河2号数值模拟表明相比CPU版的数值模拟,CPU-MIC异构众核环境下数值模拟在单MIC卡和64块MIC卡分别取得了6.93和6.0倍的加速比.

英文摘要:

Massively parallel computing is becoming a primary tool for the numerical simulation of planetary fluid dynamics. In this paper, Numerical simulation of the planetary fluid dynamics for distributed memory Xcon Phi-accderated systems is studied. Firstly, we start from a legacy parallel code [1-3] using PETSc software package, which employs a pure MPI approach for parallel computing, to date, is in lack of support for multi-threaded parallelism on many- core accelerated systems, and then we extend the legacy code to multi-threaded parallelism on Xeon Ph~-accderated systems. Furthermore, based on PETSc software package, a sparse linear solver for Xeon Phi-accelerated cluster, which utilizes restarted generalized residual method(GMRES(m)), is presented and optimized. Secondly, a novel sparse matrix-vector multiplication(SpMV) algorithm for Xeon Phi-accelerated cluster is proposed, it combines highly aggressive use of asynchrony with offload, compute, communication, M1 of which serve the overlap of computation and communication. What's more, based on our SpMV algorithm, a polynomial preconditioner is given, which mainly consists of SpMV operations, hide and reduce communication, whether to local memory, across the network, or over PCIe. Finally, some optimized measures are taken to the extended code. Experiments on Tianhe- 2 Supercomputer show that as compared to the original code, our Xeon Phi-accelerated design is able to deliver 6.93x and 6.00x speedups for single MIC device and 64 MIC devices, respectively.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《数值计算与计算机应用》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算数学
  • 主编:张林波
  • 地址:北京市海淀区中关村东路55号
  • 邮编:100190
  • 邮箱:
  • 电话:010-62555115
  • 国际标准刊号:ISSN:1000-3266
  • 国内统一刊号:ISSN:11-2124/TP
  • 邮发代号:2-413
  • 获奖情况:
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2000版)
  • 被引量:1895