位置:成果数据库 > 期刊 > 期刊详情页
DNA保守序列识别算法的并行化和MPI集群环境构建
  • ISSN号:1672-5565
  • 期刊名称:生物信息学
  • 时间:0
  • 页码:190-193
  • 语言:中文
  • 分类:Q52[生物学—生物化学]
  • 作者机构:[1]西安交通大学生命科学与技术学院生物医学信息工程教育部重点实验室,西安710049
  • 相关基金:国家自然科学基金(60601017).
  • 相关项目:基因调控序列的信息学识别及若干肿瘤相关基因调控序列的确定
中文摘要:

DNA序列中保守序列的识别需要较大的计算量。开发了一个转录因子结合位点识别的并行算法,能够从多条DNA序列中识别指定长度的序列模式。算法使用概率模型进行序列模式保守性的度量,利用迭代过程实现保守序列的搜索。使用C编程结合MPI消息传递模型开发了相应的程序,并在Windows平台下构建了一个3节点的集群环境,利用20个长度均为200的序列数据集进行测试,实现了模体识别工作,结果表明并行算法使模体识别的效率得到提高。

英文摘要:

It needs more computation time to recognize conservative DNA sequences. Therefore, a parallel algorithm of transcription factor binding sites (TFBS) recognition was developed, which can discover a sequence pattem of given length from a group of DNA sequences. This algorithm is based on probability model and is achieved by iteratively searching. A corresponding program was implemented based on C language and MPI message transfer model, a three - node computer cluster was constructed successfully on the Windows platform, and a multi - sequence simulated dataset was tested, which consists of 20 sequences and each of which is 200 bases long. The successful experiment result indicated the efficiency of pattern recognition was improved greatly with parallel algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《生物信息学》
  • 主管单位:中华人民共和国工业和信息化部
  • 主办单位:哈尔滨工业大学
  • 主编:任南琪
  • 地址:哈尔滨市南岗区西大直街92号136信箱
  • 邮编:150001
  • 邮箱:swxxx@hit.edu.cn
  • 电话:0451-86414260
  • 国际标准刊号:ISSN:1672-5565
  • 国内统一刊号:ISSN:23-1513/Q
  • 邮发代号:14-14
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:1292