本研究拟围绕基因表达调控网络分析这一核心问题,从生物信息学的角度出发,有效利用由基因芯片平台产生的大量基因时空表达数据,如脑发育过程中几类轴突诱向相关基因的时空表达数据(包括了不同孕期,部位的脑组织样本),探讨基因之间复杂的相互影响与调控关系。建立基因组时空表达数据库,以便于各种后续的生物信息分析;采用新的生态系统Voterra数学动力学方程描述各个特定部位基因组的调控网络;建立不同空间、时间的基因组表达差异性分析、比较方法,提取出在不同空间、时间上表达的特异基因;建立网络的可视化方法,用简单、直观的可视化技术描述脑发育过程中几类轴突诱向相关基因表达调控网络。本项目虽然针对脑发育过程中几类轴突诱向基因时空表达数据进行分析研究,但是所建立的方法也可应用于分析类似的基因时空表达数据。因此,必将为基因表达时空数据的分析探索出一套普遍适用的生物信息学方法。
按照申请书研究内容和计划,我们获得了不同孕期(2月,3月,…,9月)流产胎儿脑组织样本(包括大脑皮层,小脑,海马三个不同部位)的基因表达时间序列数据,采用10080点的高密度芯片。在芯片噪声去除及数据标准化方面进行大量研究,建立了不同情况下的标准化方法以及选择标准;采用Lotka-Volterra方程,针对这三个部位,描述了发育过程中基因之间调控的相互关系,建立起调控网络的动力学方程;利用样条插值方法得到了方程的数值解,这是本研究的重点内容,也取得了一些创新性的成果。在网络评价方面我们对本研究结果的合理性进行了验证,对其生物学意义进行了深入的探讨;同时探讨了相关系数等模型,并和其它模型进行比较分析。深入研究了特异表达基因筛选的聚类分析方法,借助Entropy参数确定最佳聚类数的计算公式,通过调节FPR确定差异表达基因;和香港城市大学合作完成了这三个不同部位、不同时间点特异基因的筛选。利用SAM和matlab软件完成了调控网络的可视化研究。本研究直接资助了两位研究生完成与基因表达相关课题的研究;资助6人次参加学术会议;邀请香港城大教授进行访问指导;资助3名研究生到香港城大进行课题研究。