位置:成果数据库 > 期刊 > 期刊详情页
人类基因PolyA位点预测
  • ISSN号:0254-4164
  • 期刊名称:计算机学报
  • 时间:0
  • 页码:927-933
  • 语言:中文
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]华中科技大学生物信息与分子成像湖北省重点实验室,武汉430074
  • 相关基金:本课题得到国家自然科学基金重大研究计划(90608020)、高等学校博士点专项科研基金(20050487037)、“教育部新世纪优秀人才”和“科技部国家科技基础条件平台建设专项”资助.
  • 相关项目:人类遗传疾病相关基因的生物信息学分析与预测
中文摘要:

mRNA3’端的多聚腺苷酸化是真核细胞内mRNA转录后处理的三个最主要步骤之一。对DNA序列上发生多聚腺苷酸化的位置即PolyA位点的识别,对于理解mRNA的形成机制以及进行基因结构预测具有重要作用。本研究利用机器学习方法对PolyA位点进行预测,其实现过程分为以下三个步骤:特征的生成、特征的筛选、特征的综合分析聚类。首先,我们采取统计k阶核苷酸频率的方法来生成初始的特征;然后,通过信息学知识来对特征进行筛选;最后,使用SVM(Support Vector Machines,支持向量机)的方法进行特征的综合分析,确定参数,建立预测模型。在独立的测试数据集上进行测试,当敏感度(Sn)固定为60%时,在内含子水平和外显子水平上的特异性(sP)分别为71.67%和80.77%,在内含子水平上的预测精度明显优于国际上的同类软件。

英文摘要:

Polyadenylation (PolyA) occurs in mRNA 3'end is one of the three main steps of eukaryotic pre-mRNA processing. The prediction of polyadenylation sites in human DNA and mRNA sequences is very important for realizing the pre-mRNA processing and prediction of gene structure. This paper presents a machine learning method to predict polyadenylation signals (PASes) in human DNA and mRNA sequences. This method consists of three steps of feature manipulation: Generation, selection and integration of features. In the first step, new features are generated using k-gram nucleotide acid patterns. In the second step, a number of important features are selected by an entropy-based algorithm. In the third step, support vector machines are employed to recognize true PASes from a large number of candidates. At last, a mathematic model forms. When the sensitivity is 60%, the corresponding specificity is 71.67% on intron level, and 80.77% on exon level.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433