开放网格服务体系结构(OGSA)中的服务容错需要可扩展的、灵活的容错框架,能够支持容错策略与应用程序的分离.针对这一需求,提出了一种基于OGSA的层次式容错处理框架.框架能根据不同服务质量需要灵活设置故障处理策略,选择不同容错机制;在此框架下,实现了基于服务实例池的热备份以及基于服务检查点的服务重构等容错机制.该容错框架及机制应用于HUSTgrid平台,较好地满足了网格服务的容错需要,并在应用系统CoGIS中得到了验证.