本研究旨在通过海量定量组学数据寻找生物分子网络中的基元功能模块。通过建立整合的生物分子网络分析系统,实现各种生物分子作用的统一整合和标准化存取,以网络为将节点分子信息串接,并将各种分析方法以插件形式整合入分析系统,实现数据和分析方法上的双重通量化。在该分析系统中利用矩阵算法和特定序参量开发出生物分子网络数据的处理新方法,以及表达谱"平面"模块扫描算法等。方法学上的成果将首先应用于肝脏相关生理和病理数据的挖掘人胎肝造血迁移期蛋白组数据、健康成人肝脏蛋白和转录表达谱数据、转移性肝癌细胞系蛋白和转录表达谱数据等,拟以乙肝病毒对人肝细胞作用入手,建立起宿主与侵袭物分子网络融合前后的动力学模型。预期在方法学产出的基础上,产出一批生物学发现和规律,锁定若干肝脏生理病理活动中的关键网络节点分子,并予以功能验证。
network;integration;module;HCC metastasis;biomarker
本项目通过整合BioPAX和KGML等数据标准,建立了兼容各种主流生物通路和蛋白-蛋白相互作用(PPI)数据库,兼顾了准入数据量的丰富性和收录信息的完备性的数据标准。在此基础上整合了7个主流的通路数据库和5个主流的PPI数据库,构建成目前世界上具有最大规模的生物分子相互作用整合数据库PathPPI。结合以蛋白质组表达谱为主的数据,自主开发“等表达量”网络模块搜索算法。以PathPPI整合网络为背景,在人类肝脏以及肝癌转移细胞株的半定量数据集上予以实施。该方法筛选出一批潜在与肝癌转移相关的分子(AKR1C1/1C2、TKT、NMI、CAV1、S100A10等),并获得体、内外功能验证和临床样本验证。建立了构建了网络节点属性关联分析策略,并获得一批蛋白固有属性间的关联分析和规律发现。将网络模块搜索和网络节点属性关联方法应用于染色体蛋白组计划(C-HPP)和蛋白丰度分布规律挖掘,获得丰富成果。编写了集成包括“等表达量”模块在内的多种搜索方法的软件NetAnalysis。