随着多核CPU和GPU技术的快速发展,电磁数值方法向并行计算方向发展是必然趋势。并行计算技术大大扩展了矩量法(MoM)的应用范围。然而,对于大型电磁目标,并行MoM仍然受到内存容量的限制,其计算时间依然比较长。为解决并行MoM所面临的问题,本项目结合定义于双线性曲面片的高阶多项式基函数,研究采用ScaLAPACK和PLAPACK通用数学库的高阶MoM并行策略,提出基于CPU和MPI的高阶MoM分布式并行核外求解方案,在此基础上探索基于GPU和CUDA的并行核外计算方案,突破显存和物理内存的限制,大幅度扩大计算规模并提高计算效率,建立高阶MoM的并行核外计算体系,用于精确高效仿真分析复杂大型电磁辐射、散射等挑战性工程课题。本项目并行核外技术研究成果可以进一步推广用于其他电磁数值方法。
Higher order basis functions;parallel strategies;two-level out-of-core;communication optimization;parallel efficiency
现代电磁工程问题的精确求解对计算资源的要求极高,因此必须借助于大规模并行电磁计算技术。并行计算技术大大扩展了矩量法(MoM)的工程应用范围,然而求解大型电磁问题时,传统并行MoM会受到内存容量的限制,所需的计算时间依然很长。 针对并行MoM所面临的问题,本项目从MoM的基函数选取出发,研究了基于双线性曲面的高阶多项式基函数,并设计了高阶MoM的阻抗矩阵并行填充策略以及矩阵方程并行求解策略。为解决高阶MoM计算能力受计算机内存限制的难题,本项目设计了基于CPU的高阶MoM并行核外策略。为进一步提高算法的求解效率和计算能力,本项目研究了基于GPU的并行核外求解技术,采用异步通信技术与cuda流技术实现了两级核外的通信优化,建立了“显存-内存-硬盘”的两级核外求解模式,完善了高阶MoM并行核外体系。 本项目在执行期间取得的成果主要包括成功实现了并行高阶矩量法的“显存-内存-硬盘”两级核外求解技术,获得了明显的加速效果;实现了高阶MoM并行规模达4096 CPU核的仿真计算;在机载天线阵列一体化精细仿真等方面取得了一系列应用成果。