位置:成果数据库 > 期刊 > 期刊详情页
基于任务负载监测的高性能集群节点启停机制
  • ISSN号:1001-3695
  • 期刊名称:《计算机应用研究》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院计算机网络信息中心超级计算中心,北京100190, [2]中国科学院研究生院,北京100049
  • 相关基金:国家“863”计划重点资助项目(2006AA01A116,2006AA01A117);中国科学院“十一五”信息化专项资助项目(INFO-115-B01)
中文摘要:

对高性能计算集群在运行过程中如何通过关闭闲置节点来实现有效节能的问题进行了研究和探讨,设计和实现了基于任务负载量统计监测的节点启停机制。根据对系统中作业运行和排队情况的记录和分析,通过参数估计设计了反映队列任务情况的负载因子,并围绕负载因子制定具体策略,结合作业系统的队列设置和资源分配规则,对集群中的空闲节点进行自动启停控制。模拟实验表明,基于任务负载监测的节点启停机制能够有效地自动启停系统中闲置的节点,从而降低系统功耗,并且对系统中作业的整体完成时间基本不造成影响。

英文摘要:

This paper discussed the method of closing idle nodes to save power in high-performance computing clusters. It proposed a mechanism for nodes start and stop control based on task load monitoring and statistics and designed task load indicator using parameter estimation. It set up detail strategies around this indicator to automatically control the idle nodes starting and stopping. It also considered queue configuration and resource allocation of job manage system in the strategies. Simulation tests indicate that the nodes start/stop mechanism can effectively control the idle nodes in the system, so that the power consumption chn be reduced; moreover, the mechanism impacts very little on the system overall job scheduling and running.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049