位置:立项数据库 > 立项详情页
辐射流体力学异构多核大型并行机的可扩展新型算法研究
  • 项目名称:辐射流体力学异构多核大型并行机的可扩展新型算法研究
  • 项目类别:重大研究计划
  • 批准号:91130024
  • 申请代码:A011711
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2014-12-31
  • 项目负责人:刘兴平
  • 负责人职称:研究员
  • 依托单位:北京应用物理与计算数学研究所
  • 批准年度:2011
中文摘要:

大型并行计算机系统实现技术的逐步成熟和价格的降低,使其成为较易获得的计算资源。但目前大型并行计算机的结构越来复杂,并行算法的构造和理论分析也越来越难,造成适应当前大型并行计算机的高效并行算法远远落后于并行数值模拟计算软件的需要,并导致高效并行数值模拟计算软件远远落后于硬件的发展。本项目针对异构多核大型并行计算机,研究影响大规模科学计算中辐射流体力学数值模拟并行计算的瓶颈问题。主要从三个途径进行研究(1) 将当前大型并行计算机的异构多核CPU、网络带宽和网络延迟等复杂体系结构引入到大型稀疏代数方程组并行算法设计中,并对算法进行收敛性分析,最终研究出适合当前复杂体系结构的高效辐射流体力学数值模拟新型可扩展并行算法;(2) 为了提高大型稀疏代数方程组的并行计算速度,研究适应新型并行算法的并行预条件技术;(3) 新型可扩展并行迭代算法及并行预条件技术的应用研究。

结论摘要:

多介质、大变形、物理量突变的辐射流体力学数值模拟需要计算的物理时间步非常多,而每个时间步又需要求解一系列大型稀疏线性代数方程组,这些方程组的求解时间占数值模拟总CPU时间的90%以上,目前世界上求解这些方程组的主要方法是预处理Krylov子空间迭代方法。另一方面,为了达到设计要求所能容忍的墙上时间,每个CPU核能处理的网格规模非常少,这样在大型异构多核并行计算机上通信次数就成了数值模拟并行计算效率的瓶颈问题。因此本项目重点研究辐射流体力学数值模拟中预处理Krylov子空间迭代法在大型异构多核并行计算机上进行数值模拟的并行计算效率的关键瓶颈问题Krylov子空间方法中降低全局通讯技术、并行预处理技术、数据存储技术等。取得进展及研究成果如下以降低全局通讯为目的,将网络带宽和网络延迟引入到并行计算新的方法设计中,提出了六种具有最优全局归约计算次数的并行Krylov子空间算法,分别是PGPBiCG(m,l)、PGGl-CGS2、IGCRS2、PGPBiCR、PCOCR和MBiCG算法,对各种算法进行了并行性和可扩展性的理论分析及大量的并行数值试验,得到了与理论分析相吻合的结果;为了解决Krylov子空间算法的并行加速问题,根据异构多核大型计算机的特征和具体物理问题形成的代数方程组的具体特征,采用多级区域分解预处理技术,构造了两个并行预处理子,且具有预处理效果好、通信代价小、可扩展性好等多项特征。数值试验验证了预处理技术的有效性;数据存储格式是影响辐射流体力学数值模拟在大型异构多核并行计算机上计算效率的关键因素之一。针对在GPU和在多CPU多核上计算的数据,分别研究出了在GPU上的BiELL和在多CPU多核上的CSB的数据存储格式,数值试验表明,可以提高一倍以上的计算性能;基于全局归约次数、网络带宽、网络延迟、浮点计算速度、问题规模和计算核数及并行计算效率等建立了并行迭代方法性能预估的数学模型。并在各种Krylov子空间并行算法的理论分析和数值试验中进行了验证。用户可根据需要选择最优的CPU核个数,克服使用CPU核个数的盲目性;在大型异构多核并行计算机上对多介质大变形、物理量突变的大型辐射流体力学应用程序进行了并行化研究和软件开发,验证了并行程序的正确性和高效性,数千CPU核并行效率达50%以上。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 21
  • 0
  • 0
  • 0
  • 0
相关项目
期刊论文 26 会议论文 6 获奖 2 专利 4 著作 1
刘兴平的项目
期刊论文 16 获奖 1