随着虚拟网络和虚拟机技术的结合,用于运行大规模并行或分布式应用的虚拟计算集群技术,作为新的高性能计算环境,逐渐得到人们的关注。但是,分布式共享环境中资源的动态性、自治性和资源竞争往往会影响虚拟集群所在物理主机的可用性。而虚拟集群的动态Live迁移技术则是保证分布式应用服务能够高效、正确执行的关键。拟申请课题将研究虚拟集群Live迁移的关键技术,使虚拟计算集群在运行过程中能够动态绑定更佳的物理宿主机、动态优化虚拟网络的拓扑结构,更好的保证用户对计算性能的要求,并保证迁移过程对并行应用程序的透明性。虚拟机迁移技术的研究日益成为国际上新的研究热点,但当前的研究工作大多局限于单个虚拟机和简单网络应用的迁移。针对集群整体计算环境和支持分布并行应用的虚拟集群迁移技术的研究还处于起步阶段,因此该项研究具有重要的理论和应用价值。
Virtual machine;Virtual cluster;Virtual network;Live migration;Parallel job
近年来,随着软件环境越来越复杂,计算资源和计算需求的日益多样化,虚拟机技术作为“云计算”的支撑重新得到人们的青睐。虚拟网络和虚拟机技术相结合的虚拟集群技术,作为新的高性能计算环境,逐渐得到人们的关注。 但是目前的研究工作局限于单个虚拟机、不能迁移一个完整的分布计算环境,也不支持并行作业的Live迁移。本课题研究支持并行计算等大规模分布式应用的虚拟集群Live迁移机制,使虚拟集群在运行过程中动态绑定更佳的物理宿主机、动态优化虚拟网络拓扑,更好地满足分布式应用对可靠性和计算性能的要求。课题建立了一套虚拟化基础设施模型;研究了支持虚拟集群迁移的虚拟网络通信机制;提出了虚拟集群并发Live迁移协议;完成了虚拟集群映射过程中的资源选择等算法研究;系统地建立了基于骨干通信网络的虚拟网络部分映射理论模型;提出了适应底层物理平台动态变化特性的在线调整重映射算法,及相关虚拟集群迁移策略。同时,针对MR模型新型云计算技术,进行了相关的资源调度问题研究。在高性能科学计算领域结合项目应用,研究并实现了一个环境科学领域的并行计算应用。本项目的相关研究成果是构建分布式虚拟计算环境的理论基础和核心技术,具有重要的理论和应用价值。