位置:成果数据库 > 期刊 > 期刊详情页
基于日志分析的超级计算机错误预测方法研究
  • 期刊名称:计算机应用研究
  • 时间:0
  • 页码:1235-1237
  • 语言:中文
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]华中科技大学软件学院,武汉430074
  • 相关基金:国家自然科学基金资助项目(60873031)
  • 相关项目:基于定量结构图实现软件系统自治功能的机器学习方法
中文摘要:

大量的错误严重影响了超级计算机系统的稳定性,错误预测对于提高其稳定性有重要作用,日志分析是进行错误预测的有效方法。建立了错误预测的基本框架,包括日志的预处理、基础预测器和联合预测器,其中基础预测器包括时间预测器和关联预测器。在BlueGene/L日志上进行的实验结果显示联合预测器的预测效果比基础预测器好。这表明错误预测要充分挖掘错误的特性,将基于各种错误特性的基础预测器联合起来进行预测才能取得满意的预测效果。

英文摘要:

Frequent failures had affected the stability of supercomputer system seriously,failure prediction was of great significance for improving the stability of the supercomputer,and log analysis was an effective way to predict failure.This paper established the basic framework of failure prediction,including log preprocessing,base predictor and joint predictor.And base predictor included time predictor and association predictor.The experiment on BlueGene/L's log shows that the prediction result of joint predictor is better than base predictor.The result indicates that failure prediction must adequately mine the characteristic of failures,and combining the base predictor based on the characteristic of failures can achieve satisfactory prediction result.

同期刊论文项目
同项目期刊论文