功耗问题和热量问题是研制新一代高性能计算机面临的严峻挑战,功耗管理和热量管理技术将是高性能计算领域研究的热点。本课题研究软件指导的高性能计算机系统功耗和热量管理技术,预期研究成果包括(1)高性能计算机系统功耗和热量测试平台及高性能计算机系统部件功耗和热量特性分析技术。(2)系统软件指导的高性能计算机系统功耗管理和热量管理技术。(3)基于程序剖视(Profile)的编译指导的高性能计算机系统功耗管理和热量管理技术。本项目的研究成果包括实际的测试环境和高水平论文,取得的研究成果将直接应用于高性能计算机系统的研制任务中。
High Productivity Computing;Power Management;Heterogeneous System;Dynamic voltage and frequency;
功耗和热量问题是研制新一代高性能计算机面临的严峻挑战,功耗和热量管理是高性能计算领域研究的热点。本项目围绕大规模计算机系统级能耗和热量管理、异构系统的功耗优化和剖视指导的功耗优化三个方面展开了深入研究,主要工作和创新包括 1、提出了基于结点分类的机群峰值功耗管理模型PCNC及相应的功耗控制算法,以可接受的管理开销和系统性能损失,有效地控制系统的运行峰值功耗。实验表明,该功耗控制系统具有较好的可扩展性,适用于大规模计算系统,两类目标结点选择策略在系统性能损失分别为1.4%和1.1%的代价下,超标功耗累积效应各自降低73%和66%,优化效果明显。 2、提出了大规模系统空闲结点的功耗管理模型ASDMIN以及对空闲结点休眠深度的自适应管理算法,以较小的响应速率损失,有效降低系统空闲能耗。实验表明,ASDMIN方法在作业平均响应延迟率仅增加8.85%的代价下,系统空闲结点功耗降低84.12%,系统空闲功效提高了82.71%,优化效果显著。 3、提出了异构系统功耗感知的并行循环调度方法。并行循环是科学与工程计算程序中的主要优化对象,项目以类OpenMP 并行程序为研究对象,研究在满足性能约束的条件下结合异构系统并行循环调度和处理器动态电压频率调节技术优化系统功耗。将异构系统并行循环调度问题归纳为一般整数规划问题,给出了该问题的求解方法。 4、提出了异构系统功耗感知的多计算段频率调节与任务划分方法。项目将异构并行程序划分为同构计算段程序和异构计算段程序。在给定执行时间的约束下,将多计算段程序能耗问题描述为一般多元极值问题,并给出了基于最优下降的启发式求解算法。 5、提出了一种面向高性能业务应用剖视指导的能耗优化技术,该技术利用系统支持的多个频率层次,建立性能约束下的能耗优化模型,优化业务应用的能耗。根据程序信息获取方式的差别,项目提出了SEOM和CEOM两种能耗优化模型。使用典型平台对能耗优化效果进行了验证,串行程序最大获得12.2%的能耗节省,OpenMP程序最大获得16%的能耗节省。