本项目的研究内容为集成大规模高通量生物数据,利用计算模型在基因、转录因子、及其活性度的三个层次上重建基因、蛋白质和小分子化合物之间的时变及条件依存结构的调控网络。也即,(1)集成时序列microarray等数据,提出时变或条件依存结构的基因调控网络重建模型和算法,并推导出条件或环境与基因调控强度的定量关系。(2)集成时序列microarray、ChIP-chip等数据,提出时变或条件依存结构的转录调控网络重建模型和算法。(3)集成时序列microarray、ChIP-chip、蛋白质相互作用及各种异源生物数据,提出转录因子活性化网络重建模型和算法。并对糖尿病动物模型,由三个层次的基因网络,在系统的角度上研究在糖尿病不同发展阶段中转录因子之间的协作关系,推断与条件或调控过程密切相关的活性网络、信号传导通路及网络生物标记。
gene regulatory network;activity network;network reconstruction;network biomarker;network ontology analysis
该项目的研究内容为集成大规模高通量的数据,重建基因调控网络,发展基因网络的理论模型及高效率计算方法。特别是集成基因表达、蛋白质相互作用等各种异源生物数据,提出转录调控网络重建模型和算法;开发转录调控因子活性化网络模型和算法;提出了网络功能标注的理论和方法;并从糖尿病动物模型上,推断与条件或调控过程密切相关的活性网络和重要调控因子,由此在基因层次上揭示2型糖尿病的重要调控过程和其分子机制。主要研究成果如下。1 开发了利用信息熵理论来推断基因调控网络的新模型和算法(NARROMI),该方法利用分子表达信息可推出了具有直接调控关系的基因或蛋白质相互作用,由此重构生物系统的基因调控网络。2 整合多种异源生物数据,开发调控因子活性化网络模型和算法(APG),并从理论上给出唯一解的条件,多组实验数据都证实了APG的有效性。3 提出了网络功能标注的理论和方法 (NOA),NOA已被包括在系统生物学代表性应用软件系统Cytoscape中,内容也已入选F1000中。4 从糖尿病动物模型,推断与调控过程密切相关的活性网络和重要调控因子,特别是发现调控因子SP1在糖尿病大鼠和正常大鼠的调节作用有很大变化。 进一步分析,我们发现SP1与一些重要基因共表达。我们的生物实验结果也表明,Sp1在正常大鼠中有活性,在糖尿病大鼠中活性消失。通过siRNA干扰SP1活性后,我们发现抑制SP1活性主要通过增加糖原裂解,加强肝细胞释放葡萄糖到血液中。我们还发现BAHD1通过SP1调节GCK表达,同时SP1抑制明显改变胰岛素的作用,包括明显降低胰岛素受体表达。我们的结果,特别是这个调控因子SP1(功能)的发现对于糖尿病的分子机理研究具有重要意义。本项目实施过程中,在国际SCI期刊上发表(标注)论文42篇, 申请计算机软件著作权3件。支持3位博士后及培养4名研究生。此外,本研究的工作在国外媒体有广泛报道,本研究的内容和方法论已被仔细整理,形成一门研究生课程(即,中科院上海生科院 生物信息学研究生课程)。项目组通过积极参与组织相关领域主流国际会议、项目负责人作为大会主席组织五次相关国际学术会议(ISB2012, TBI2012, ISB2013, InCoB2013, CSHA2013),为推动本交叉学科发展,成立了第一个全国性学会组织,中国运筹学会《计算系统生物学分会》(首任理事长)。