针对大规模分布式系统环境,尚没有完整的生存性模型的研究成果.缺少对运行系统进行在线、实时的生存性异常事件检测方法,而分布式系统的规模逐渐增加使得传统的基于复杂数学模型的方法无法应用。本项目以大规模分布式系统生存性异常检测为目标,以分布式系统测度属性关联分析为研究对象,针对目前的研究成果中缺少分布式系统测度属性关系网络构建和测度属性关系网络增量式划分模型等问题,重点研究基于时空关联分析的分布式系统测度属性关系网络构建技术;基于隐马尔可夫模型的测度属性关系网络增量式划分方法,基于测度属性关联分析的多粒度生存性异常检测模型。最终得到分布式系统测度属性之间的关联关系,利用动态划分结果分析、划分类内关联度计算、特定属性关联度计算等手段确定系统生存性异常事件,并给出多粒度的检测结果。该研究对于在分析大规模分布式系统环境下的服务生存性具有重要的理论意义和应用价值。
large-scale distrubited system;survivability analysis;measure attributes;network segmentation;anomaly detection
随着网络规模的不断扩大、用户需求的不断膨胀和新服务的不断增加,分布式系统得到了广泛的应用。但是分布式系统的资源分布化、用户分布化、计算分布化和管理分布化特点,给系统的安全性评估带来了很多新的挑战.迫切需要研究针对于大规模分布式系统环境下的服务生存性, 本项目结合分布式系统的自身特点,以分布式系统测度属性关联分析为研究对象,从测度属性关系网络构建、关系网络划分以及生存性异常检测方法出发,提出一套面向大规模分布式系统的生存性异常检测方法,主要的研究内容包括三个方面 (1) 分布式系统测度属性关系网络构建详细论述了测度属性特征向量的相关性,并建立了相关模型;建立了一个“特殊”的网络结构对测度属性数据的分布进行了研究;利用贝叶斯理论对测度属性对的演化特征进行了研究,并给出了测度属性关联度的计算方法。 (2) 测度属性关系网络划分方法使用隐马尔科夫模型对测度属性关系网络进行形式化描述;利用马尔可夫随机场与吉布斯(Gibbs)随机场相对应的原理,将网络划分问题转化成求解隐含划分类符号分配的概率最大化问题;研究使用迭代条件模型算法求的具有最大概率的隐含划分符号,进而得到测度属性的划分类。 (3)多粒度分布式系统生存性异常检测建模研究了分布式系统生存性异常的层次化检测方法,按照异常事件所覆盖的范围将异常检测分为系统整体、划分类、具体属性三个层次,并分别展开了研究;利用划分结果变化、类内关联度计算以及属性关联度计算的方法达到确定系统生存性异常事件的目的。 本项目对分析大规模分布式系统环境下的服务生存性具有重要意义,同时也对传感器网络、自组织网络的生存性分析提供有益的帮助。