针对多介质辐射流体力学问题,结合异构多核千万亿次并行机体系结构多核处理器缓存命中率、指令级并行效率和系统通讯带宽、通讯延迟、问题规模和问题结构等因素,研究异构多核下的并行性能评估数学模型;结合辐射流体力学问题的计算与通讯特征,及异构多核并行机多核之间共享缓存、单核内对同步多线程的支持及单节点内处理核数量多的特点,研究并行性能优化技术;充分发挥多核对数据密集型处理快的特点,研究新的区域分解并行预处理技术;基于降低全局通讯次数,研制适合于异构多核并行机的并行Krylov迭代方法,解决迭代方法并行计算的瓶颈问题;基于GPU-CPU混合编程模式,研制适合于异构多核千万亿次并行机的并行线性代数解法器,使得所研制的方法可扩展到上万个核,并行效率达到30%以上;研究适合于异构多核并行机的混合精度Newton-Krylov子空间迭代方法;将所得成果应用于辐射流体力学实际问题的数值模拟,提高模拟的整体效率。
Radiative hydrodynamics;Heterogenous multicoer;Performance evaluation and optimization;Parallel iterative methods;Parallel preconditioning techniques
针对多介质辐射流体力学问题,结合异构多核千万亿次并行机体系结构多核处理器缓存命中率、指令级并行效率和系统通讯带宽、通讯延迟、问题规模和问题结构等因素,研究了异构多核下的并行性能评估数学模型;结合辐射流体力学问题的计算与通讯特征,及异构多核并行机多核之间共享缓存、单核内对同步多线程的支持及单节点内处理核数量多的特点,研究了一系列并行性能优化技术;充分发挥多核对数据密集型处理快的特点,研究了多级区域分解并行预处理技术;基于降低全局通讯次数,研制适合于异构多核并行机的一系列并行Krylov迭代方法,解决迭代方法并行计算的瓶颈问题;基于GPU-CPU混合编程模式,研制适合于异构多核千万亿次并行机的并行线性代数解法器软件包,实现了混合精度Newton-Krylov子空间迭代方法;研制的方法和技术可扩展到12万个核,并行效率达到80%以上,提高了辐射流体力学数值模拟的整体效率。