位置:立项数据库 > 立项详情页
面向异构多核千万亿次并行机的辐射流体力学并行算法研究
  • 项目名称:面向异构多核千万亿次并行机的辐射流体力学并行算法研究
  • 项目类别:面上项目
  • 批准号:61170309
  • 申请代码:F020305
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2015-12-31
  • 项目负责人:谷同祥
  • 负责人职称:研究员
  • 依托单位:北京应用物理与计算数学研究所
  • 批准年度:2011
中文摘要:

针对多介质辐射流体力学问题,结合异构多核千万亿次并行机体系结构多核处理器缓存命中率、指令级并行效率和系统通讯带宽、通讯延迟、问题规模和问题结构等因素,研究异构多核下的并行性能评估数学模型;结合辐射流体力学问题的计算与通讯特征,及异构多核并行机多核之间共享缓存、单核内对同步多线程的支持及单节点内处理核数量多的特点,研究并行性能优化技术;充分发挥多核对数据密集型处理快的特点,研究新的区域分解并行预处理技术;基于降低全局通讯次数,研制适合于异构多核并行机的并行Krylov迭代方法,解决迭代方法并行计算的瓶颈问题;基于GPU-CPU混合编程模式,研制适合于异构多核千万亿次并行机的并行线性代数解法器,使得所研制的方法可扩展到上万个核,并行效率达到30%以上;研究适合于异构多核并行机的混合精度Newton-Krylov子空间迭代方法;将所得成果应用于辐射流体力学实际问题的数值模拟,提高模拟的整体效率。

结论摘要:

针对多介质辐射流体力学问题,结合异构多核千万亿次并行机体系结构多核处理器缓存命中率、指令级并行效率和系统通讯带宽、通讯延迟、问题规模和问题结构等因素,研究了异构多核下的并行性能评估数学模型;结合辐射流体力学问题的计算与通讯特征,及异构多核并行机多核之间共享缓存、单核内对同步多线程的支持及单节点内处理核数量多的特点,研究了一系列并行性能优化技术;充分发挥多核对数据密集型处理快的特点,研究了多级区域分解并行预处理技术;基于降低全局通讯次数,研制适合于异构多核并行机的一系列并行Krylov迭代方法,解决迭代方法并行计算的瓶颈问题;基于GPU-CPU混合编程模式,研制适合于异构多核千万亿次并行机的并行线性代数解法器软件包,实现了混合精度Newton-Krylov子空间迭代方法;研制的方法和技术可扩展到12万个核,并行效率达到80%以上,提高了辐射流体力学数值模拟的整体效率。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 65
  • 3
  • 0
  • 0
  • 2
期刊论文
相关项目
期刊论文 75 会议论文 63 专利 12
期刊论文 1 会议论文 11
期刊论文 7 会议论文 16 专利 4
谷同祥的项目