在中国HPC硬件性能连续问鼎世界Top10之后,将峰值速度指标与"超大规模计算应用实现"并重将成为未来中国HPC事业中顶天"立地"(真正发挥机器的效能)的大事。目前在材料科学和工程领域,将材料微结构的变形演化机理与宏观力学性能之间建立"定量"联系是极其重要而典型的大规模计算课题。本项目从材料微结构有限元模拟的数值困难和大规模计算的需求特点出发,发展一种有望完全克服网格扭曲的"可移动自然协调型局部无网格方法"。本方法的创新之处在于在"严格"满足数学协调性的前提下,实现有限元和无网格两种计算格式的"动态直接"耦合,通过拉格朗日描述与局部有限元网格分离彻底解决网格扭曲的问题。与以往方法最大的区别是新方法允许局部无网格计算区域自由移动、增加、和减少而无需任何特殊的网格处理。在大规模问题的计算方面,所发展的方法能够发挥局部无网格计算的灵活性而保留大规模有限元计算的高效率。
localized meshfree;GPU;Mixed Precision Calculation;Hybrid parallel;large scale simulation
可移动自然协调型局部无网格法(CLMM)的关键在于严格满足数学协调性的前提下,实现有限元和无网格计算的动态直接耦合。本项目以大规模计算力学应用问题为背景,发展一种能有效克服网格扭曲的可移动自然协调型局部无网格方法和相应的三维并行程序。新的方法具有下列特点? 允许局部无网格计算区域自由移动,增加,和减少? 能够在任意非连续网格组合上自然满足数学上的协调性? 能够有效克服局部网格扭曲? 更适合大规模并行计算 在算法理论研究方面,针对三维自然协调型局部无网格插值方法,研究了其在大变形问题中的应用方案,插值逼近过程,克服局部网格扭曲的技术,并进行了收敛阶测试及误差分析,最后完成了1D,2D,3D问题情况下的数值测试验证。在程序开发上,完成了并行计算方案的设计,前处理算法与程序实现等。现有研究结果表明,所发展的可移动自然协调型局部无网格方法兼具局部无网格的灵活性和全局有限元计算的高效性。另外,在本项目的资助下,基于本研究的成果,课题组在广义有限元方法的理论方面取得了一定进展。论文发表在CMAME第7期上。对该工作,匿名独立审稿人给予了较高的评价“祝贺,非常优秀的工作!作者在单位分解方法和广义有限元领域提出了一种新的解决方案。祝贺作者在这一方向取得如此优秀的成果。过去十年间,该领域发展了众多的方法(XFEM, GFUM, PUM, intrinsic XFEM/PUM, hp-clouds等)。本文的工作提出了一种实现简单,却具有普遍适应性的新方案。因此,我强烈推荐本文的发表。最后,为了方便读者能够更清楚的阅读和理解,建议摘要和序言部分稍作修改。”。 在程序开发方面,将CLMM算法集成到课题组已有的大规模并行多尺度有限元程序msFEM中,并突破性地实现了纯CPU、GPU双精度以及GPU混合精度三个大规模并行版本。三个版本目前的测试结果为msFEM_CPU版本在美国橡树岭国家实验室的Jaguar/Titan(项目执行期间为世界排名第一)超级计算机上实现了从2万到20万CPU核的可扩展性测试,在80亿自由度的测试规模下,20万核的并行效率为71%。msFEM_GPU采用MPI+OpenMP+CUDA的混合并行模式实现了GPU全双精度和混合精度两个版本。GPU版在Jaguar(美国的首台千万亿次CPU-GPU混合架构超级计算机)和华南超算中心