由于信息访问的在线化趋势,导致网络存在大量的流动信息。信息流动形成巨大、复杂的拓扑结构,对其拓扑特征的分析对于网络监测、流量分析、数据部署、用户行为分析等实际应用都具有十分重要的意义。目前拓扑分析技术仅针对小规模、静态、缓慢变化的拓扑,不适用于超大规模的、高速演化的、时序的、高复杂度的信息流动的复杂拓扑特征分析。根据典型的拓扑特征计算阶段划分,本课题在前期工作的基础上进一步重点研究信息流动的复杂拓扑特征计算。针对各个阶段的难点问题,主要研究信息流动的复杂拓扑特征度量、基于层次模型的子拓扑概要抽取技术和高效的信息流动拓扑特征计算算法。本课题的研究涉及拓扑分析、分布式数据流计算、不确定数据建模等多个相关领域,具有很高的理论研究价值和应用价值。
information flow; topological characteristic;data stream;hierarchy model;
信息流动形成的巨大、复杂拓扑结构,具有超大规模的、高速演化的、时序的、高复杂度的特点,对目前拓扑计算分析技术提出了巨大挑战。本课题重点研究此类动态拓扑流的复杂拓扑特征计算,主要研究信息流动的复杂拓扑特征度量、基于层次模型的子拓扑概要抽取技术和高效的信息流动拓扑特征计算算法。主要研究成果有(1)针对动态拓扑的宏观特性,提出通过分形维数刻画网络整体性质,通过欧氏空间与拓扑结构的映射,给出网络维数的相关概念与计算方法,计算分析了时间维相关特征,并定性定量分析了各类主要度量之间的关联。(2)针对信息流动拓扑的海量高速特性,提出拓扑核数在线计算方法,并在此基础上给出拓扑数据的层次概要化方法,保留拓扑特性的同时大幅降低数据存储压力。通过分析真实拓扑子集合并的情况,进一步给出拓扑层次概要数据的合并方法,满足分布式数据采集与集中计算的需求。(3)针对拓扑流数据的高效计算需求,提出最短路径长度的估算算法,能够以较高的精确度估计任意核数节点对之间的最短路径长度,并进一步提出一系列基于概要化数据的度量估算方法,在满足分析精度的前提下提高了特征计算速度。(4)针对拓扑数据采集与处理,提出对单源点测量数据进行修正,提高其数据精度至可用程度,降低了数据采集成本,并设计了一个高效灵活的数据存储处理系统,采用分布式计算模型,对大规模拓扑数据进行高效处理。