具有良好算法和并行可扩展能力的线性解法器是在数千个处理器上完成精细数值模拟的重要支撑。代数多重网格(AMG)是当前科学与工程计算中线性解法器采用的最有效的迭代方法之一。然而,对于在数千个处理器上的复杂物理系统数值模拟应用,现有的AMG方法无法取得理想的可扩展能力,迫切需要一系列新的算法和技术改变现状。本项目围绕这一前沿问题,面向数千个处理器,重点研究新的并行AMG算法、理论和并行实现技术,研制高效并行AMG解法器软件包,期望改善并行AMG算法在数千个处理器上的可扩展能力。在此基础上,本项目将瞄准高能量密度物理领域中若干重要的实际应用问题,支撑该类应用的数值模拟扩展到数千个处理器,并取得理想的数值模拟性能。本项目具有很强的应用需求牵引,并将直接服务于实际物理系统的大规模数值模拟,具有很强的理论和实际应用价值。
Parallel Scalability;Linear Solver;Algebraic Multigrid(AMG);Iterative method;Radiation Hydrodynamic Simulat
代数多重网格(AMG)是当前科学与工程计算中线性解法器采用的最有效的迭代方法之一。然而,对于在数千处理器核上的实际数值模拟应用,现有的AMG无法取得理想的可扩展能力,迫切需要新的算法和技术。本项目面向数千处理器核,重点研究同时具有良好算法和并行可扩展能力的并行AMG 算法、面向实际应用特征的并行AMG算法,以及研制高效并行AMG 解法器软件,在此基础上,支撑典型应用高效扩展到数千处理器核。具体取得如下4个方面的重要进展 (1)针对迭代方法,提出一种基于渐近规模的通信与计算比性能分析方法。重点分析了AMG算法中光滑迭代过程的并行可扩展性能,成为本项目算法研究的基础。该工作获得2012年全国高性能计算学术年会(HPCChina2012)优秀论文奖。 (2)基于“同时具备良好算法和并行可扩展能力”的原则,提出两种新的AMG算法基于自适应Setup的并行AMG算法(aSetup-AMG)和基于代数界面的AMG算法(aiAMG)。这两个算法分别采用不同的途径,前者在保持算法可扩展的前提下,通过设计自适应Setup策略,提高并行效率。后者在保持并行可扩展的前提下,通过代数界面捕捉复杂应用的多尺度特征,并对代数界面进行特殊处理,从而提高算法的鲁棒性和计算效率。 (3)针对辐射流体力学的应用特征,提出一种基于物理的粗化算法,由此构造了一类AMG预条件子,显著提高了三温热传导模型的计算效率。 (4)集成本项目提出的三个新算法,研制了并行AMG解法器JXPAMG。由于该解法器采用了aSetup-AMG算法的流程,使得JXPAMG不同于目前国际上其他的AMG解法器软件(如广泛使用的Hypre中的BoomerAMG解法器),尤其是在大规模计算时具有明显优势。基于该解法器,在4096个处理器核上,支撑辐射流体力学界面不稳定性模拟在国内首次实现三维热传导建模的大规模计算,取得具有显示度的模拟成果。目前,JXPAMG已经成功应用于国家点火工程重大专项的激光聚变数值模拟中。 本项目紧密围绕“数千处理器核上的算法设计-软件研制-实际数值模拟应用”这一主线,实践“算法-软件-应用”的融合,显著提升了激光聚变应用在数千处理器核上进行大规模模拟的能力,效果明显。本项目的研究思路及成果对当前国产千万亿次和未来更高性能超级计算机的实际应用具有重要的参考意义和价值。