系统生物学的最终研究目标是集成各种不同层面的信息,为生物体的结构组织和功能组成提供完整的、系统的图谱。基因表达和代谢流量分析可以看作是调控细胞新陈代谢过程的起点和终点,在生物技术和生物数据受限的情况下,集成分析新陈代谢过程的起点和终点,对于完整揭示新陈代谢过程是可行的和必要的。本项目研究将集中探索当细胞的生长环境或遗传条件发生改变时,细胞的调控如何从基因表达调控网络传递到代谢网络,使得代谢网络能够在短短的几分钟内寻找到新的最优生长表型并稳定下来。我们猜想,端通路是代谢表型转换的基本组件,调控层面的信息通过共发生反应集合传递到端通路。我们将从多层面验证这个猜想,研究方法将突破FBA类方法采用确定性的布尔表达式描述随机的调控过程,并提出一个新的代谢网络动态表示模型。站在系统生物学的角度,从整个基因组和细胞所处的环境出发,系统的考察基因和代谢通路的功能。
metabolic networks;extreme pathways;regulatory constraints;correlated reaction sets;
随着各类组学数据(omics data)的日益丰富,对细胞的代谢系统进行自底向上的建模成为可能,越来越多的基因组规模代谢网络模型陆续诞生,基于约束的代谢网络重构和分析方法(COBRA)日益成熟,带领代谢研究步入了系统生物学时代。本文以基于约束的代谢网络重构和分析框架为依托,对代谢网络的模型和计算分析及与其它生物网络的比较进行了深入探索,主要工作包括 (1) 调控约束作为细胞自身的约束,不同于物理化学等约束,是不时变化的。如何才能使得调控约束尽可能准确地反映到代谢网络上呢?课题组结合高通量的Microarray数据,提出了调控约束的定量化。基于布尔型调控网络和COBRA代谢网络模型,对代谢基因受到调控约束后的表达进行定量计算,依据酶和反应的关系,使得重构的代谢网络体现了定量化调控约束的影响。 (2) 端通路是代谢网络的稳态所组成的凸空间的凸基向量,可以线性组合表示出所有稳态集合。端通路的计算是NP-hard问题。本文提出两种新的端通路计算方法,一种方法是基于混合整数线性规划的计算方法,该方法使用“拐角点”采样结果作为混合整数线性规划方法的初始点,将端通路路径长度作为目标函数进行优化。另一种方法基于单纯形中顶点旋转的理论来进行计算。 (3) 研究了代谢网络上的关联反应集及其相关的计算方法。因为关联反应集中的成员反应在流量上总是存在一定程度的相关关系,并且它们往往表现出共调控的特点,所以这类反应所组成的集合引起了研究者的浓厚兴趣。本文建立了一套横向比较体系,分别从敏感性、一致性与完备性、灵活性和可伸缩性等四个方面详细考察了不同关联集计算方法之间的异同。同时,在保持各方法主要逻辑的前提下,本文对其中的一部分进行了改进以提升原有方法在使用中的表现。 (4) 对代谢网络、转录调控网络模型和转录翻译网络模型从5个方面对端通路进行分析和比较端通路的个数和通路个数与反应个数的比值、端通路长度、反应参与程度、共出现反应对、通路内部联系程度。通过比较能够反映不同类型生物网络在拓扑结构、确定性以及冗余性方面的差异,并说明端通路除了能够反映代谢网络的性质,也能应用到转录调控和转录翻译网络当中,即在这两种新的网络模型中同样具有生物意义。同时,改进了转录调控网络模型的表示方法。