论文部分内容阅读
双序列比对是生物信息处理中最基本的问题,是生物信息学重要的研究内容。评价生物序列比对算法有两个标准,一是算法的运算速度,二是获得最佳比对结果的敏感性。随着生物学数据的大量积累,对序列比对算法对运算速度提出了更高的要求,开发高效率的算法成为双序列比对研究中的瓶颈问题。双序列比对基本的算法是Needleman-Wunsch算法,该算法有两步:第一步根据动态规划思想计算得分矩阵,第二步由得分矩阵回溯得到最优比对。理论上分析,计算得分矩阵占用Needleman-Wunsch算法大量时间。针对这一问题,本文基于多核体系结构,对Needleman-Wunsch算法进行了并行优化。其基本思想是采用流水线技术,利用多线程分行计算得分矩阵。为减少线程间的交互时间,在计算得分矩阵过程中采用分块技术。在真实DNA序列上进行序列比对的实验结果表明,Needleman-Wunsch算法的并行优化算法时间开销减小,得到较高的加速比。