细胞网络的比较研究旨在从细胞网络中提取进化、环境和疾病等的信息,建立网络结构与这些因素之间的关系。本项目首先在随机矩阵理论框架下,从复杂网络谱发展一套适合于网络比较的复杂网络结构特征量,也就是满足动力学相关、多尺度与消除网络结构噪声的网络结构特征量;然后被用于提取现实细胞网络的结构特征,与生物进化、生态学等成果的比较,找到进化、环境、疾病与网络结构的定量关系;在此认识基础上考察评价细胞网络的现有理论模型,建立新的理论模型,加深对生命进化等基本问题的认识;也用于疾病的评价和预测,细胞网络的设计,试图在这方面有一些有益的成果
metabolic network;small set of records;metabolic enviroment;evolution of celluar network;
本课题着重研究了两方面的内容生物等复杂系统中小数据分析问题和细胞网络环境和进化特征提取.(1)生物系统一般涉及多个元素和环节,是典型的高维问题,但是由于测量手段限制和样本活性要求,数据一般很少并且噪声很大. 如何从有限数据取得有效的统计特征,是一个基本问题. 在本项目中我们发展了扩散熵平衡估计理论,该理论有效地降低了噪声和系统误差带来的影响,能准确给出几百个长度的短序列隐含的自相似统计特征.我们也发展起来了一种基于最小生成树的阈值确定办法,来从面板数据构建多因素之间的关系网络.这些方法可以从,比如microarray等,数据构建功能或者调控关系网络.(2)细胞网络是遗传和环境长期共同作用的结果,从细胞网络中提取环境和进化信息是认识生命机理和应用于医学等的基础.我们采用复杂网络上的不同频率的振动模式提取了复杂网络上从单节点到宏观尺度的协同工作的结构,发现这些结构特点与节点的寿命有着很好的单调关系.我们采用种子集概念提取出了代谢网络里环境必须提供的代谢物作为环境的描述,探讨了在大肠杆菌的致病可能的机理(34种)和12种果蝇生存环境.发现致病的大肠杆菌需要一些特殊的代谢物维持生存,这些代谢物必须由环境提供.这些代谢物的缺乏可能是致病的直接原因,也就是通过破坏所在的组织器官结构,来试图获得生存需要的物质.总之,通过这些理论方法的建立和数据库的准备,为更加系统深入地拓展本项目的研究奠定了基础.