位置:成果数据库 > 期刊 > 期刊详情页
有Mate-Pairs的个体单体型MSR问题的参数化算法
  • ISSN号:1000-9825
  • 期刊名称:软件学报
  • 时间:0
  • 页码:2070-2082
  • 语言:中文
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中南大学信息科学与工程学院,湖南长沙410083, [2]湖南师范大学物理与信息科学学院,湖南长沙410081
  • 相关基金:Supported by the National Natural Science Foundation of China under Grant No.60433020 (国家自然科学基金); the Program for New Century Excellent Talents in University of China under Grant No.NCET-05-0683 (新世纪优秀人才支持计划); the Program for Changjiang Scholars and Innovative Research Team in University of China under Grant No.IRT0661 (国家教育部创新团队资助项目 ); the Scientific Research Fund of Hunan Provincial Education Department of China under Grant No.06C52 (湖南省教育厅资助科研项目 )
  • 相关项目:生物信息学中的相关组合理论和算法研究
中文摘要:

个体单体型MSR(minimumSNPremoval)问题是指如何利用个体的基因测序片断数据去掉最少的SNP(single—nucleotidepolymorphisms)位点,以确定该个体单体型的计算问题对此问题,Bafna等人提出了时间复杂度为O(2^kn^2m)的算法,其中,m为DNA片断总数,n为SNP位点总数,k为片断中洞(片断中的空值位点)的个数由于一个Mate—Pair片段中洞的个数可以达到100,因此,在片段数据中有Mate—Pair的情况下,Bafna的算法通常是不可行的.根据片段数据的特点提出了一个时间复杂度为D(n-1)(足广1)k22^2k+(k1+1)^2k+nk2+mkl)的新算法,其中,k1为一个片断覆盖的最大SNP位点数(不大于n),k2也为覆盖同一SNP位点的片段的最大数(通常不大于19),h为覆盖同一SNP位点且在该位点取空值的片断的最大数(不大于也).该算法的时间复杂度与片断中洞的个数的最大值k没有直接的关系,在有Mate—Pair片断数据的情况下仍然能够有效地进行计算,具有良好的可扩展性和较高的实用价值.

英文摘要:

The individual haplotyping MSR (minimum SNP removal) problem is the computational problem of inducing an individual's haplotypes from one's DNA fragments sequencing data by dropping minimum SNPs (single-nucleotide polymorphisms). To solve the problem, Bafna, et al. had provided an algorithm of time complexity o(2^kn^2m) with the number of fragments m, the SNP sites n, the maximum number of holes k in a fragment. In the case that there are some Mate-Pairs, since the number of holes in a Mate-Pair can reach 100, Bafna's algorithm is impracticable. Based on the characters of DNA fragments, this paper presents a new algorithm of time complexity O((n-1)(k1-1)k22^2h+(k1+1)2h+nk2+mkl) with the maximum number of SNP sites that a fragment covers kl (no more than n), the maximum number of the fragments covering a SNP site k2 (usually no more than 19) and the maximum number of fragments covering a SNP site whose value is unknown at the SNP site h (no more than k2). Since the time complexity is not directly related with k, the algorithm can deal with the MSR problem with Mate-Pairs efficiently, and is more scalable and applicable in practice.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《软件学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院软件研究所 中国计算机学会
  • 主编:赵琛
  • 地址:北京8718信箱中国科学院软件研究所
  • 邮编:100190
  • 邮箱:jos@iscas.ac.cn
  • 电话:010-62562563
  • 国际标准刊号:ISSN:1000-9825
  • 国内统一刊号:ISSN:11-2560/TP
  • 邮发代号:82-367
  • 获奖情况:
  • 2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:54609