GPU集群计算技术是目前国内外高性能计算研究的热点,对生物、金融、气象等需要进行大规模数据处理的领域具有重要意义。虽然通用并行计算架构如CUDA能够有效地发挥GPU的计算能力,但这些加速(协)处理器的使用带来了新的通信和存储等问题,使GPU集群整体的计算能力难以得到高效利用。本课题从计算、通信和存储三方面考虑与性能相关的体系结构因素,建立适用于异构GPU集群的性能模型;通过分析GPU集群上典型应用的计算模式,提出面向异构GPU集群的混合粒度任务模型,在此基础上实现任务协同调度与动态均衡机制;基于分布式数据管理机制和高效通信机制实现支持多种调度策略的高性能计算框架,并采用大规模计算问题进行效能测试与调优。课题针对GPU带来的新结构特征和编程模型,从提高异构GPU集群计算效能角度提出混合粒度任务调度与动态均衡机制,为异构GPU集群大规模计算研究和应用提供新思路和方法。
英文主题词GPU cluster;hybrid-grained;co-scheduling;dynamic balancing;CUDA