位置:成果数据库 > 期刊 > 期刊详情页
面向蛋白质功能位点识别的机器学习平台构建
  • ISSN号:1001-0505
  • 期刊名称:《东南大学学报:自然科学版》
  • 时间:0
  • 分类:Q811[生物学—生物工程]
  • 作者机构:[1]东南大学生物电子学国家重点实验室,生物科学与医学工程学院,南京210096
  • 相关基金:资助项目:国家自然科学基金(60671018,60771024).
中文摘要:

有关蛋白质功能的研究是解析生命奥秘的基础,机器学习技术在该领域已有广泛应用。利用支持向量机(support vector machine,SVM)方法,构建一个预测蛋白质功能位点的通用平台。该平台先提取非同源蛋白质序列,再对这些序列进行特征编码(包括序列的基本信息、物化特征、结构信息及序列保守性特征等),以编码好的样本作为训练数据,利用SVM进行训练,得到敏感性、特异性、Matthew相关系数、准确率及ROC曲线等评价指标,反复测试,得到评价指标最优的SVM模型后,便可以用来预测蛋白质序列上的功能位点。该平台除了应用在预测蛋白质功能位点之外,还可以应用于疾病相关单核苷酸多态性(SNP)预测分析、预测蛋白质结构域分析、生物分子问的相互作用等。

英文摘要:

Research of protein function is the base of life mystery,and machine learning technology is widely used in this field.This paper constructs a general platform using support vector machine(SVM) to predict protein function sites.Firstly,the platform extracts non-homologous protein sequences,and codes characteristics which include basic information,physical and chemical characteristics,structure information,sequence conservation characteristics.Then uses SVM to train the coded dataset,and get sensitivity,specificity,Matthew correlation coefficients,accuracy and ROC curve.Finally,get the best model and use it to predict the unknown protein function sites.Moreover the platform can be used to analyze disease and the related SNP,predict protein domain,biomolecular interaction and so on.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《东南大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:东南大学
  • 主编:毛善锋
  • 地址:南京四牌楼2号
  • 邮编:210096
  • 邮箱:xuebao@seu.edu.cn
  • 电话:025-83794323
  • 国际标准刊号:ISSN:1001-0505
  • 国内统一刊号:ISSN:32-1178/N
  • 邮发代号:28-15
  • 获奖情况:
  • 先后荣获第三届国家期刊奖百种重点期刊奖,2006-2...,2013年荣获首届江苏省新闻出版政府奖"报刊奖"
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23651