建立表型与基因型的关联是连接实验室和临床以及微观分子和宏观疾病现象的重要课题,是适应临床实现转化医学的关键。基于表型与基因型关联的多层级复杂网络为我们认识生命系统以及疾病规律提供了重要支撑技术,已经成为研究热点。由于人体生命系统以及疾病现象的复杂性,目前基于功能基因组信息的表型与基因型功能关联存在关键的缺陷,即基因功能信息(多样性)与表型信息(简化性)的不对称性,为本项目提出一新的课题,旨在集成中医学中丰富表型数据资源(临床文献、临床病历数据)和现代医学多样性数据资源(MEDLINE,各种分子作用网络数据库等),通过数据整合和复杂网络分析,以获得宏观表型信息如症状体征和疾病等的微观分子网络功能模块如基因/蛋白质网络模块,并确认网络模块中相应节点的功能角色。本项目的研究成果为症状体征或疾病分子网络功能模块的发现提供一种有效的数据分析方法,将极大地推动表型与基因型关联研究进展。
network medicine;symptom phenotype;symptom gene prediction;;
1. 项目完成情况概述围绕表型(特别是症状)与基因型关联的数据整合和网络分析问题,本课题按照预先研究计划,完成了预期研究结果。同时,在症状的分子网络关联基础研究方面取得了突出进展,形成了以症状为中心的疾病、基因/蛋白质及其网络数据库,扩展进行了中药靶点预测分析研究。症状在现代疾病分类、诊断和治疗方面具有基础性作用,也是实现临床个体诊疗的主要依据,但其分子机理研究一直不被重视。本课题的研究提示症状在疾病分类和关联中的分子网络机理,从而为开展症状的分子网络机理研究工作提供了思路和研究基础。 2. 成果简介面向临床表型(特别是症状体征)与基因型关联的研究问题,本课题就症状的分子网络机理及其预测,症状命名实体抽取方法,以及疾病表型的分子模块及其药物靶点进行研究,取得了具有积极意义的研究结果。发表核心期刊以上学术论文18篇,出版英文专业书籍章节1篇(本课题负责人为第一或通讯作者18篇;SCI 6篇,其中本课题负责人为第一或通讯作者4篇)。1篇SCI论文(本课题负责人是第一作者和通讯作者)发表在Nature communications(Nature 子刊,该刊最新影响因子为10.742,在综合性期刊中排名第三)。通过本课题研究,初步形成了如下主要研究结果。 2.1 建立了以症状为中心的表型基因型关联数据平台,进行人类症状疾病网络研究,探索症状与基因关联的网络机理,形成了症状的分子网络机理基本理论认识。 2.2 研制了多种进行表型基因型关联网络研究的分析算法。包括(1)基于Bubble-bootstrapping的条件随机场症状命名实体抽取方法,实现中医临床病历中症状命名实体的自动抽取,相关方法能够获得87%的F1值;(2)基于数据整合和网络推理的症状基因预测分析方法,实现症状的相关基因预测,实现了两种方法PRINCE_SB方法获得了84.3%的AUC值;而基于药物副作用和症病关系结合的方法,则获得了0.093的排序分。 (3)基于网络共性属性扩展的药症关系分析方法,通过研究表明中医临床诊疗数据中存在药症对应关系,同时,我们提出了一种新颖的基于中药关联扩展的相关分析算法框架,能够消除假阳性的药症关系。 2.3 进行了癫痫的疾病分子网络模块及其药物靶点示范性分析。发现了具有临床意义的疾病模块和可能具有潜在价值的癫痫治疗药物新靶点。