信息网络环境中,主题数据的存在形式由数值演化为网络,传统的数据仓库、数据立方、OLAP等技术不再适用。而现有的Graph OLAP技术由于缺乏系统性的良数据组织、中间结果物化、高效算法设计等必备基础,无法提供灵活有效的信息网络多维分析处理支持。 为此,本项目拟提出对信息网络进行面向主题组织的建模思想和由信息网络仓库(InfoNetWarehouse)到信息网络立方(InfoNetCube)再到在线图处理(OLGP)的技术路线,旨在为信息网络的多维分析处理提供高效、良结构的数据基础设施。具体包括(1) 拟提出InfoNetWarehouse的概念并研究其模型设计和实施方案。(2) 拟提出InfoNetCube的概念并研究其计算路线、关键结构和算法。(3)拟提出并研究基于PC-Matrix的I-OLGP和T-OLGP算法和基于发现驱动的T-OLGP实现路线。
On-Line Graph Process;information network;data warehouse;topological dimension;
本项目针对大规模信息网络在线图处理的难点问题,逐步深入,相继提出信息网络数据仓库的设计、信息网络的数据立方设计与部分物化、在线图处理算法的具体设计、实施且原型化等工作。主要进展包括(1) 提出信息网络数据仓库设计与实现解决面向主题、集成的信息网络数据仓库组织问题,(2) 提出在线图处理(OLGP)算法的设计解决以图为核心的复杂度量、信息网络立方计算等的组合爆炸、拓扑维计算复杂等问题,(3) 提出信息网络的可视化模型与算法解决信息网络图处理可视化问题,(4) 探索基于拓扑维上卷为核心的优化进行融合复杂图度量的高效计算问题,包括最短路径、极大连通性等问题,包括两个核心的高效的算法,(5) 探究基于拓扑维结构的信息网络聚类问题、实体识别问题、角色演化等问题,相继提出多个有效的算法及解决路线。此外,项目将研究与应用相结合,基于航空网络这一具体的信息网络实例开展较广泛的应用基础研究。研究内容涵盖机场拥挤预测、航班延误预测、基于航线网络的航班延误预测问题等,同时集成涵盖相关研究的原型系统。相关结果发表论文15篇,申报专利6项,出版译著1部。