本课题对大规模科学计算中,辐射流体力学数值模拟的并行计算瓶颈之一- - 全局归约计算进行研究,将网络带宽和网络延迟引入到并行计算方法的设计,解决辐射流体力学大规模并行计算的瓶颈问题。同时建立全局归约次数、网络带宽、网络延迟、每个处理的计算量与并行计算效率的关系的数学模型,为取得最佳的计算效率选取CPU数,提高辐射流体力学在大型并行计算机上并行计算效率,推动我国大型高性能并行计算机的发展。
Krylov子空间算法的全局归约计算问题是辐射流体力学大规模并行计算的主要瓶颈之一。我们提出了两种解决方案降低全局归约次数和将内积计算用其它计算所代替,从而完全消除全局通讯。在第一种方案中提出了五种并行Krylov子空间算法,对各种算法进行了并行性和可扩展性的理论分析,并进行了大量的并行数值试验,得到了与理论分析相吻合的结果;在第二种方案中,提出了多搜索方向共轭梯度方法,该方法完全消去了全局归约引起的全局通讯,对方法的收敛性、相容性、收敛速度等进行了详细的理论分析和证明,并进行了大量的并行数值试验验证了方法的高效性及所得理论结果;在数学模型建立方面,我们将网络带宽和网络延迟引入到并行算法分析中,以Krylov子空间算法为例,建立了全局归约次数、网络带宽、网络延迟、每个处理的计算量与并行计算效率的关系的数学模型。指导大型并行计算机用户,选择最优的CPU个数,克服使用CPU个数的盲目性。最后我们还对大型辐射流体力学应用程序进行了并行化研究和软件开发,验证了并行程序的正确性和高效性,为进一步研究和方法检验奠定了基础,并对二维变系数抛物方程的区域分裂并行算法进行了研究。