如何提高下一代基因序列比对是当前生物信息学中一个重要的问题.当前广泛使用的下一代基因序列比对方法BWA由于需要对基因片段在一定编辑距离内进行模式穷举,会浪费大量的计算资源与时间.所介绍的演示系统基于BWA,提出了一种结合数据挖掘方法的匹配剪枝策略,能大大降低穷举模式的代价,从而显著提高算法效率.实验表明,本系统相比时下流行的系统效率提升20%左右,并且能够输出成通用的输出格式,已具备实用性.
如何提高下一代基因序列比对是当前生物信息学中一个重要的问题.当前广泛使用的下一代基因序列比对方法BWA由于需要对基因片段在一定编辑距离内进行模式穷举,会浪费大量的计算资源与时间.所介绍的演示系统基于BWA,提出了一种结合数据挖掘方法的匹配剪枝策略,能大大降低穷举模式的代价,从而显著提高算法效率.实验表明,本系统相比时下流行的系统效率提升20%左右,并且能够输出成通用的输出格式,已具备实用性.