位置:立项数据库 > 立项详情页
生物网络数据分析与挖掘中相关理论与关键技术
  • 项目名称:生物网络数据分析与挖掘中相关理论与关键技术
  • 项目类别:重点项目
  • 批准号:60933009
  • 申请代码:F0205
  • 项目来源:国家自然科学基金
  • 研究期限:2010-01-01-2013-12-31
  • 项目负责人:高琳
  • 负责人职称:教授
  • 依托单位:西安电子科技大学
  • 批准年度:2009
中文摘要:

蛋白质作用网络是系统生物学的核心研究内容,挑战是如何构建可靠的蛋白质网络,并对其进行分析和挖掘,以获取生物体的结构和功能信息。提出多因素模式识别理论,对蛋白质相互作用进行可靠性评估,建立反映动态特性的蛋白质作用网络模型。从复杂系统的角度,研究蛋白质网络的拓扑结构特征,基于系统的核与核度理论、图挖掘理论和组合优化方法,识别蛋白质网络中不同层次的功能单元模体、模块及基于网络比对的保守模块,运用于疾病基因的发现、蛋白质功能和关键蛋白质的预测及基于网络数据的系统进化分析。利用网络的动态特性研究基础网络层次上的蛋白质网络的动态干预理论与优化方法,设计针对动态蛋白质作用网络的模块挖掘算法,从而便于进行功能预测以及模块进化分析。本项目的特色体现在提出新的理论框架和体系,研究蛋白质网络的构建、优化和控制,结合模式生物实验数据,研究有效识别网络结构和功能模块的新算法,开发蛋白质网络结构层次的分析软件。

结论摘要:

1、在复杂网络拓扑特征与结构分析方面进行了深入研究。提出了结构属性量化指标,揭示了拓扑结构模式与动态控制功能的稳定性联系,解决了如何提高网络控制鲁棒性问题。提出了基于谱空间几何特征刻画网络节点间通信性的结构分析方法,发展了谱聚类理论基础,有效解决了复杂网络结构划分和社团分解系列问题,该成果被Physics Reports引用和高度评价。 2、在生物模式挖掘与功能预测方面进行了系统深入的研究。对模体、模块、通路等不同层次功能结构,提出了系列子图模式高效挖掘算法,解决了不同层次生物网络功能模式检测问题,推进了图模型模式挖掘问题的深入研究。构建了双色网络模型,首次解决了大规模LncRNA功能预测问题,成功预测了鼠的1625条LncRNA功能,可成功应用于人类,引起广泛关注和NAR等引用。 3、在复杂疾病模式发现方面进行了深入研究。建立了基于全基因组变异和不同层次网络模型的疾病基因预测和致病机理分析方法,解决了多种复杂疾病的多致病因素预测问题,成功预测了年龄相关黄斑变性疾病的新SNP,发现了与乳腺癌、阿尔茨海默病和二型糖尿病相关的潜在疾病基因。系列成果可应用于其它复杂疾病研究和生物标志物的识别。 4、在模式发现理论与方法方面进行了深入研究。提出了数据独立的核函数用于优化核方法分类性能的核函数,提出了通过学习距离测度以实现强噪声情况下的鲁棒数据聚类算法。针对现有子空间聚类分析在区分类簇形状体积方面的不足,提出基于混合模型的子空间聚类算法。系列成果可应用于生物靶标识别与疾病预测。本项目实施过程中,在著名生物信息学国际期刊(NAR、PLoS One、BMC Bio.等)和国际会议(RECOMB、APBC、IEEE BIBM等)发表(含已录用)论文76篇,其中国际SCI期刊46 篇,国内EI一级学报10篇。撰写专著《生物网络数据模式挖掘与应用》,翻译专著《基因组信号处理》,培养博士12名、硕士35名,申请公开国家发明专利3项。项目组通过积极参与相关领域主流国际会议、邀请国外专家访问等方式,与国外同行进行了深入的学术交流与合作。参与组织国际学术会议1次,参加国际学术会议22人次,组织全国生物信息学联合会议1次。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 70
  • 14
  • 3
  • 0
  • 1
期刊论文
相关项目
期刊论文 36 会议论文 7 专利 2 著作 1
期刊论文 16 会议论文 12 著作 1
期刊论文 37 会议论文 4 获奖 2
高琳的项目