位置:立项数据库 > 立项详情页
单氨基酸多态的疾病相关性预测及分析
  • 项目名称:单氨基酸多态的疾病相关性预测及分析
  • 项目类别:青年科学基金项目
  • 批准号:30800641
  • 申请代码:C060701
  • 项目来源:国家自然科学基金
  • 研究期限:2009-01-01-2011-12-31
  • 项目负责人:叶志强
  • 负责人职称:博士后
  • 依托单位:中国科学院上海生命科学研究院
  • 批准年度:2008
中文摘要:

疾病往往与基因组变异如单核苷酸多态(SNP)和拷贝数变异(CNV)有关。高通量技术的迅猛发展生成了大量未经注释的变异数据,故挖掘和预测疾病相关的基因组变异是目前生物信息学研究中非常重要的课题。鉴于SNP中的单氨基酸多态(SAP)的特殊重要性,通过计算手段对其进行疾病相关性预测的工作已大量展开。但是,已有算法往往依赖于有限的预测属性且多是对机器学习算法的简单套用。本项目一方面探索了一系列新属性包括蛋白质相互作用网络的介度和众多KEGG通路的富集分数,另一方面也尝试了对数据集进行适当分类后再分别训练机器学习分类器。研究结果表明,这两方面的改进都可以提高预测分类器的准确度前者采用近邻法通过交叉验证获得了约80%的准确率,后者采用支持向量机相比不分类训练提高了约3.7个百分点。这对开发高准确率预测软件打下了良好基础。此外,从CNV数据中挖掘与疾病相关的子集也是迅速兴起的研究热点。作为本项目的重要拓展,我们采用比较基因组芯片杂交技术从二型糖尿病(T2D)模型GK大鼠中鉴定出了一批CNV,并且采用生物信息学方法优选出了与T2D高度疑似相关的16个蛋白质编码基因和2个小RNA基因,以供实验验证。

结论摘要:

英文主题词bioinformatics; single amino acid polymorphism; disease-association; machine learning


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 4
  • 0
  • 0
  • 0
  • 0
相关项目
期刊论文 11 会议论文 5
期刊论文 13 会议论文 36 著作 1
叶志强的项目