位置:成果数据库 > 期刊 > 期刊详情页
一种新的CpG岛的位置识别算法
  • ISSN号:1000-1220
  • 期刊名称:小型微型计算机系统
  • 时间:2012
  • 页码:1557-1563
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]扬州大学信息工程学院计算机系,扬州225127, [2]南京大学计算机软件新技术国家重点实验室,南京210093
  • 相关基金:国家自然科学基金项目(61070047)资助
  • 相关项目:蚁群优化算法的搜索偏离性研究
作者: 刘维|陈崚|
中文摘要:

随着多数生物基因组测序工作的完成,基因识别就显得尤为重要.CpG岛在基因组中有着重要的生物学意义,因此识别CpG岛将有助于基因的识别.目前已经构建的一些识别CpG岛的位置的模型大都存在标注偏差、需要独立假设等缺点,为此提出一种基于条件随机场(CRFs)模型的CpG岛的位置识别的新方法.该方法将识别CpG岛的位置的问题转化为序列标记问题,并根据CpG岛的位置的性质设计了相应的模型构建、训练以及解码的算法.利用本文算法可以对输入序列确定最有可能的标注序列,从而识别CpG岛的位置.通过对标准数据库的数据进行测试,其实验结果表明本文算法是可行的、高效的,比HMM方法有更高的准确率.

英文摘要:

While the genomes of the organisms have been sequenced,gene prediction becomes one of the most important projects.CpG islands are of important biological significance in the genomes.CpG islands location identification is helpful for gene prediction.In order to overcome the shortcomings of existing models such as the strong independence assumptions which generative model must have,the label-bias problem exhibited by maximum entropy markov model and other non-generative models,we present a novel method for CpG islands location identification based on conditional random fields model.The method transforms the problem of CpG islands location identification into sequential data labeling.Based on the properties of CpG islands location,we design the corresponding methods of model constructing、 training and decoding.In this paper,we also design the corresponding feature functions and obtain the weights from the joint distribution over the label sequence given observation through a learning procedure on training data.Then according to the distribution model obtained,we can determine the labeled sequence with maximum probability and thereby identify the location of CpG islands.We test our algorithm by the use of the data sets from the standard database.The experimental results show that compared with other traditional algorithms,our algorithm is more practicable and efficient than the method of HMM.

同期刊论文项目
期刊论文 62 会议论文 11 获奖 6
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212