位置:成果数据库 > 期刊 > 期刊详情页
支持矢量机和线性判别分析对细胞穿透肽的识别
  • ISSN号:0567-7351
  • 期刊名称:《化学学报》
  • 时间:0
  • 分类:TP391.41[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]重庆大学生物工程学院,重庆400030, [2]四川理工学院化学与制药工程学院,自贡643000, [3]四川理工学院材料与化学工程系,自贡643000
  • 相关基金:国家自然科学基金(No.20775096)资助项目.
中文摘要:

选取25条CPP和16条非CPP作为训练集样本,以61条CPP和21条非CPP为预测集样本.利用氨基酸的z-Scale对肽链进行编码,分别使用原始72个自交叉协方差变量和它们的主成分矢量进行线性判别(LDA)和支持矢量机(SVM)分类研究.当采用LDA方法时,对于训练集的预测以及它们的留一法交互检验,均获得比较优越的结果,但对预测集的预测总的识别率的最优结果仅为57.3%.分别利用主成分和原始变量集作为SVM的输入建立的非线性识别模型,对训练集的总识别率分别为85.4%和100%,留一法交互检验的总识别率分别为80.5%和75.6%,对预测集的最优总识别正确率为74.4%.识别结果表明SVM能够比较好的提取原始变量间的细微模式变化,对CPP总的识别结果优于LDA.

英文摘要:

In order to identify new potential CPPs, two methods, fisher's linear discriminant analysis (LDA) and support vector machine (SVM), have used to construct two classifiers. We have identified 123 known natural CPPs from the literature and used them to construct 2 data sets, the training set with 25 CPPs and 16 non-CPPs and the test set with 61 CPPs and 21 non-CPPs. The auto cross covariances (ACCs) by describing each amino acid by principal properties (z-scales) and their main compounds were used to con- struct classifiers, respectively. The obtained models, using fisher's LDA, were only able to classify correctly 57.3% on test sets, whereas these models showed large classification rates on the training sets in training and cross-validation procedures. The classification rates using SVM tool were 100% (75.6%) and 85.4% (80.5%) on the training test in training (Loo-cross-validation), when 72 ACCs and their main components were used for classification. The best result for SVM classification on test set is 74.4% using 72 ACCs. These results validate that the SVM can extract the minor change in variables. The SVM's model is better than LDA model.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《化学学报》
  • 北大核心期刊(2014版)
  • 主管单位:中国科学院
  • 主办单位:中国化学会 中国科学院上海有机化学研究所
  • 主编:周其林
  • 地址:上海市零陵路345号
  • 邮编:200032
  • 邮箱:hxxb@sioc.ac.cn
  • 电话:021-54925085
  • 国际标准刊号:ISSN:0567-7351
  • 国内统一刊号:ISSN:31-1320/O6
  • 邮发代号:4-209
  • 获奖情况:
  • 首届国家期刊奖,第二届国家期刊奖提名奖,中国期刊方阵“双高期刊”
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),荷兰文摘与引文数据库,美国科学引文索引(扩展库),日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:28694