东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

多序列星比对算法的改进及其在Spark中的并行化研究

ISSN号：1002-137X
期刊名称：《计算机科学》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：内蒙古农业大学计算机与信息工程学院,呼和浩特010018
相关基金：国家自然科学基金（61063004,61363006）; 内蒙古自然科学基金（2015MS0605,2015MS0626,2015MS0627）; 内蒙古教育厅高校研究项目（NJZC059）; 教育部留学人员基金（[2014]1685）; 内蒙古自治区科技计划项目：穿透降水量GSM网络在线监测与数据传输系统的研制资助

关键词：多序列比对, 星比对算法, K-mer, SPARK, RDD, Mul t iple sequence al ignment, Ce n te r s ta r me th o d, K -me r, S p a rk, R D D

中文摘要：

多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度耗费了大量时间,因此提出了通过综合计算每个序列产生的k-mers及各个k-mer在各序列中出现的次数来确定k-mers的拼接选择,由k-mers进行拼接从而得到中心序列。进而,在双序列比对过程中采用搜索两个序列最大相似子串的思想,改进的星比对算法的精度在一定程度上得到了明显提升。接着,将改进的星比对算法在Spark中进行并行化设计与实现。采用Spark的Yarn-Client运行模式,对正常人线粒体的多组数据进行实验,分析了算法性能上的不足及改进方向。

英文摘要：

Because center star alignment algorithm needs to calculate the distance and scores of any two input sequences when determining the central sequence,it caused the high time complexity.A strategy for determining the assembling selection of k-mers was proposed by synthesizing computing the k-mers generated by each sequence and the number of occurrences of each k-mer in each sequence.Furthermore,in the process of pair wise sequence alignment,the idea of searching two sequences of the largest similar sub-sequences was used.The accuracy of the improved center star alignment algorithm is improved with a certain degree.The improved center star alignment algorithm was parallelized designed and implemented in Spark.Spark＇s Yarn-Client running mode was used to experiment the multi-group data of normal mitochondria.The performance of the algorithm was analyzed and the direction of improvement was analyzed.

同期刊论文项目

正则图控制数及其相关问题的研究

期刊论文 22 会议论文 5

基于云计算和数据空间的网络安全态势感知关键技术研究

期刊论文 10

同项目期刊论文

Semantic Description and Verification of Security Policy Based on Ontology

一种控制流基本块的静动态结合反汇编方法

多路径并行传输的路径动态决策方法

基于SDN的多路径并行传输数据调度方法

基于UDP的空地一体化网络域间路由实现

计算机与农业机械化的相关性研究

基于树莓派的隐蔽式渗透测试方法

一种基于分层多代理的云计算负载均衡方法

基于改进差别矩阵和专家知识的态势指标提取算法

基于非简单的失效独立的路径保护圆的抗毁性光纤网络优化设计(英文)

可扩展的节点保护的预连接圆的设计

蚁群优化算法的研究与改进

基于局部递归的动态多点初始化请求集生成算法

基于折半加一的分布式循环请求集生成算法

The Cloud computing tasks scheduling algorithm based on improved K-Means

Ant Colony Algorithm Dynamically Adjust the Parameters Based on Chaos Theory

基于有限递归的最短长度循环请求集生成算法

基于贪心策略的高效能分布式请求集生成算法

一种贪心策略的更高效的请求集生成算法

Optimal band selection and application of multi-spectral remote sensing image

流体网络图形管理系统的设计与实现

并行计算在计算最小皇后独立支配集的应用

基于三角重组位置修正的DV-Hop混合定位算法

基于不同段保护的优化圈保护研究

求解旅行商问题的并行计算平台设计与实现

基于三角重组位置修正的DV—Hop混合定位算法

基于MapReduce的动态自适应蚁群算法设计与实现

基于RSSI的质心定位算法的改进

基于Multisim的双模加法计数器的设计与应用

基于非简单的失效独立的路径保护圆的抗毁性光纤网络优化设计

期刊信息

《计算机科学》
北大核心期刊（2011版）

主管单位:重庆西南信息有限公司（原科技部西南信息中心）
主办单位:重庆西南信息有限公司（原科技部西南信息中心）
主编：陈国良
地址：重庆市渝北区洪湖西路18号
邮编：401121
邮箱：jsjkx12@163.com
电话：023-63500828

国际标准刊号：ISSN：1002-137X
国内统一刊号：ISSN：50-1075/TP
邮发代号:78-68

获奖情况:
2001年重庆市优秀期刊,2004年第三届重庆市优秀科技期刊,2005年重庆市优秀期刊编辑部,2010年第六届重庆市期刊综合质量考核"十佳科技期刊",2012年重庆市出版专项资金报刊资助项目（重庆市新...,2013年重庆市出版专项资金重点学术期刊资助项目（...,2014年重庆市出版专项资金期刊资助项目（重庆市文...,2015年"中国国际影响力优秀学术期刊"

国内外数据库收录:
波兰哥白尼索引,美国乌利希期刊指南,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:41227