如何从海量数据中准确有效地获得基因间相互作用的信息,构建合适的形式化模型,研究分析基因组数据间的关系并从中发现生物学规律,是后基因组时代的重要课题。目前构建分子网络的计算方法只涉及到挖掘两两元素间的联系。申请人在近几年的研究中发现,上述计算方法不足以描述生物系统内相互作用"网络"的复杂性。因此,本项目建立高阶逻辑的复杂网络理论及其分析方法;基于该理论,拟建立系统生物学不同层次的高阶逻辑复杂网络;利用该分析方法对所建复杂逻辑网络的整体结构和结构组分进行分析,旨在发现其对应实际生物系统的功能模块及主要生化反应模式;建立复杂逻辑网络中关键元素逻辑网络,并对其连续化微分动力学和离散动力学进行分析;将上述所得理论、建模和分析方法应用于拟南芥和肿瘤的分期、分型问题。本项目将为研究生物系统内在机理提供理论及分析方法。通过发现的生物功能模块、模体等,为生物学家预测基因的未来表达和内在机理提供新的分析手段。
systems biology;logic network;genome-wide;DNA methylation;
本项目对基因逻辑网络中高阶逻辑产生的方法、逻辑种类、逻辑有效函数以及逻辑网络中相继故障、传播机理、同步现象等理论及其分析方法和应用进行了研究。在理论方面,借鉴模糊论和线性方程的思想,讨论了二值(布尔)逻辑网络在连续基因表达谱数据和敲除数据基础上的构建理论和方法;探索了三值逻辑网络在离散数据基础上的构建理论和方法,推广了三值逻辑网络中一些结构参数节点强度、聚集系数、最短路径、介数、核数、模体和社团结构等,通过对这些统计量的分析和研究来了解复杂逻辑网络的整体和组分结构。在应用方面,分别探讨了基因逻辑网络分析方法在三类数据(基因表达谱数据、全基因组数据、DNA甲基化数据)中的应用。整合DNA甲基化和基因表达数据,识别了与乳腺癌和结肠腺癌疾病相关的基因和基因模块。考虑到全基因组数据中单个单核苷酸多态性(Single Nucleotide Polymorphism,SNP)间存在的复杂关联关系(即网络结构),筛选对网络结构具有显著贡献的“结构性关键SNPs”。仿真结果表明结构性关键SNPs的选取方法能够有效地筛选出预先设定的致病SNPs及其对应基因。研究发现的疾病致病基因、生物功能模块、模体等,为生物医学家分析疾病发生、发展的内在机理提供新的方法和手段。