位置:成果数据库 > 期刊 > 期刊详情页
支持向量机在基因核心启动子识别中的应用研究
  • ISSN号:1674-568X
  • 期刊名称:《基因组学与应用生物学》
  • 时间:0
  • 分类:Q811.4[生物学—生物工程]
  • 作者机构:咸阳职业技术学院, 西安交通大学
  • 相关基金:国家自然科学基金项目《基因调控序列的信息学识别及若干肿瘤相关基因调控序列的确定》(60601017)资助
中文摘要:

核心启动子是DNA转录起始位上游一段可以与引发转录但又不被转录的关键序列。目前启动子预测已经有许多的研究,但预测的准确程度仍有待提高。支持向量机是主要用于分类的一种机器学习方法,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。本研究采用支持向量机的机器学习方法,以多聚体词频统计和核酸序列正交编码两种特征提取方式,使用公共数据库提供的测试数据,对若干包括启动子和非启动子的大量核酸样本序列进行启动子识别和10折的交叉校验研究,发现核酸序列正交编码方式预测的准确率优于多聚体方式,而支持向量机的四种核函数中RBF核函数预测的准确性最高。研究还发现采用不同的序列长度(起始从-249到-100),预测准确度都接近,反映启动子与非启动子的核酸序列模式差异主要位于转录起始位上游-100到下游+50这段区间内,启动子序列中碱基G和C出现的频率显著性高于A和T,而非启动子正好相反。

同期刊论文项目
同项目期刊论文
期刊信息
  • 《基因组学与应用生物学》
  • 北大核心期刊(2011版)
  • 主管单位:广西大学
  • 主办单位:广西大学
  • 主编:朱玉贤
  • 地址:广西南宁市大学东路100号广西大学西校园《基因组学与应用生物学》编辑部111室
  • 邮编:530004
  • 邮箱:gab@hibio.org 571388455@qq.com
  • 电话:0771-3239102
  • 国际标准刊号:ISSN:1674-568X
  • 国内统一刊号:ISSN:45-1369/Q
  • 邮发代号:48-213
  • 获奖情况:
  • 全国优秀高校学校自然科学学报,教育部优秀科技期刊,广西优秀科技期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),英国农业与生物科学研究中心文摘,美国剑桥科学文摘,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:4299