识别疾病相关的异常基因转录调控关系是疾病分子机制研究中的核心问题。虽然近年来转录组检测技术的普及为疾病研究带来了极大便捷,但目前仍然缺乏直接针对该问题的数据挖掘技术。基于近几年兴起的差异共表达分析技术,有希望发展出有效的解决方案。然而由于差异共表达分析方法设计上的缺陷,目前鲜有将该研究思想直接应用于疾病相关异常调控机制的挖掘。在前期工作中,我们发展了定量的差异共表达分析方法,克服了当前方法学上的主要缺陷。本课题首先将进一步优化差异共表达分析算法,在此基础上综合差异表达、差异共表达等多种基因表达属性,引入调控相关的生物学知识,发展差异调控关系识别算法。随后将新方法应用于典型的复杂疾病II型糖尿病(T2D),识别其异常调控关系,推进发病机制研究。最后,从多种复杂疾病的转录组数据出发,基于异常调控机制的相似度计算疾病之间的距离,为复杂疾病机理的研究、治疗策略的发展提供新的视角和有价值的数据资源。
expression correlation;transcriptional regulation;differential coexpression analysis;differential regulation analysis;human disease network
识别疾病相关的异常基因转录调控关系是疾病分子机制研究中的核心问题。虽然近年来转录组检测技术的普及为疾病研究带来了极大便捷,但领域内仍然缺乏直接针对该问题的数据挖掘技术。近几年兴起的差异共表达分析技术为该问题的解决带来了新的可能性。然而由于差异共表达分析方法设计上的定性而非定量的缺陷,在很长时间内未能被直接应用于疾病相关异常调控机制的挖掘。在前期工作中,我们发展了定量的差异共表达分析方法,克服了方法学上的主要缺陷。在本课题实施过程中,我们首先进一步了优化差异共表达分析算法,综合差异表达、差异共表达等多种基因表达属性,引入调控相关的生物学知识,将其发展成为差异调控关系识别算法。随后,我们将新方法应用于肿瘤学研究,识别其异常调控关系,推进发病机制研究。在肝癌样本中识别到阶段特异的基因功能网络和全过程动态功能模块,为进一步深化研究肝癌的分子机制提供了线索。在胃癌的异常基因转录调控机制研究中,我们构建了正常、瘤腺、癌症三个状态下的基因调控网络并对其进行了差异分析,筛选到16个差异调控基因,并提出了关于GATA6和ESRRG两个基因在胃癌发展过程中的差异调控机制假说。最后,我们从多种疾病的转录组数据出发,基于异常调控机制的相似度计算疾病之间的距离,构建了人类疾病网络及相关数据库,为方便同行开展研究,我们将鉴定疾病间相关关系的方法开发为R工具包。通过寻找疾病在失调机制上的相似性而构建的疾病间相互关系网络,提高了我们对疾病机理的认识,为研究疾病的致病机理和扩展药物的应用范围提供了调控层面的理论基础,也为我们将已知疾病的治疗策略迁移到其相似的疾病中提供了方法学支持。