基于混合并行计算的遗传退火多序列比对算法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:yongleyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的高速发展使得生物序列数据呈爆炸性增长,如何高效处理和分析这些海量数据,是当前要面对的一个挑战。序列比对是生物信息分析最基本的处理方法,由于比对过程耗时极大,利用并行计算技术对计算加速成为重要研究课题。而混合并行模型是近年来通用并行计算平台的新热点,它可充分发挥并行系统的综合计算能力。因此结合基于消息传递MPI、共享内存的OpenMP和CUDA并行编程模型,实现基于多机、多核CPU、众核GPU的并行模型,将该模型应用于序列比对研究是一个很有前景的研究方向。  基于遗传模拟退火多序列比对(GSA-MSA)算法是全局比对算法,论文主要对混合并行下的GSA-MSA算法进行并行化研究。为了实现并行加速,对混合并行系统的硬件架构、执行模型、混合编程编译方法和并行性能指标等进行详细研究,剖析GSA-MSA算法的实现原理和串行算法特点,对其潜在多层次并行性进行挖掘。针对该算法在多种的混合并行模型下进行全面的多级并行化设计与实现,分别设计单节点内CUDA并行算法、多节点间的MPI+OpenMP、MPI+CUDA、MPI+OpenMP+CUDA的混合并行算法,并且从通信、任务划分、负载均衡、存储方式方面进行优化处理。  在并行算法的性能评估中,利用5种参数模型测试分析算法的适应度结果、执行时间、加速比和可拓展性;对混合并行算法的通信代价、负载均衡和内存容量耗用进行算法的适用性测试分析;最后综合分析评估各种参数模型下多种GSA-MSA混合并行算法的整体性能。实验取得了以下的研究结果:  1、各个混合模型的 GSA-MS A并行算法都能保持和串行算法的结果误差小于0.15%,在序列数量越大、长度越小时,并行算法的执行速度越具有明显优势。  2、在加速比测试中,五个参数模型的并行算法都有较好加速效果,单节点内CUDA算法最高加速比达到113.60;4节点MPI+OpenMP达到13.88以上;由于测试环境各节点内只有一个GPU,MPI+CUDA与MPI+OpenMP+CUDA的加速比相差不大,OpenMP加速效果不明显。三层混合算法对长序列的加速比达到256.86,短序列可高达393.42。另外,并行算法拥有较好的可拓展性,在增大种群数量和温度控制时,加速效果更为明显,增大遗传迭代次数时,各参数模型的加速效果基本一致。  3、并行算法适用性评估中,三层混合并行算法能很好的控制通信代价,通信耗时占总时间的2.23%以下。节点间的计算时间差不大于总时间的6.69%,负载均衡较为理想,节点内也实现了良好的动态线程块和线程分配方式。此外,测试中,GP U显存耗用不到217MB,说明还有一定的可提升空间。  实验结果表明,混合并行的GSA-MSA算法在保持了串行算法的敏感度下,具有较好的加速比、可拓展性和适用性。研究成果对混合并行计算的研究和多序列比对并行化研究具有一定的参考价值与实用意义。
其他文献
为探索公共突发事件期间民众在网络空间争相转发分享信息时表现出的群体性特征,以2012年发生的雅安地震、2013年发生的彝良地震、2009年爆发的甲型H1N1流感疫情、2013年爆发
随着机器人等复杂控制系统的发展,对于驱动机构精密度和稳定性能的要求日益提高。传统上由多个单自由度驱动元件和复杂机械传动机构组成的控制系统虽然满足了对于复杂系统多维运动控制的要求,但其复杂的控制策略和机械机构的配合误差成为系统性能的一个重要瓶颈。作为多自由度驱动元件的球形电机简化了系统机构,提高了系统动稳态性能,成为当前机电驱动元件的研究前沿之一。 本文研究的稀土永磁球形步进电动机是一种新型的
无线传感器网络(Wireless Sensor Networks, WSN)在军事、医疗和环境健康监测等领域具有重要的应用价值,而可靠性评估是其走向实际应用的关键步骤。受节点状态的组合复杂性制
随着互联网技术与通信技术的发展,信息技术已然成为21世纪时代的主流,智能终端设备的单一化已经满足不了人们的需求,这时具有“数字家庭”概念的智能家居应运而生,且在国内迅
随着互联网的普及,电子邮件以其快捷,方便的优点逐渐发展成为人们工作和生活的重要通信工具之一。然而,随之而来的垃圾邮件问题也日益严峻,它不仅传播有害信息,而且耗费大量
Peer-to-Peer(P2P)即对等网,是指采用分布式方式来共享资源或完成某种特定功能的系统和应用。随着个人PC机性能的增强,P2P受到越来越多的关注和研究,致使各种P2P产品层出不穷
随着并行计算机系统的快速发展,科学家越来越多的使用并行计算机系统来解决一些需要大量计算的问题。近几年CPU的性能和并行计算机的通信性能有了很大的进步,然而并行计算机的I
由于电信管理网(Telecommunications Management Network,TMN)越来越复杂,网络功能不断增加,基于传统的TMN标准的各种管理应用开始显示出其一定的局限性。而CORBA(Common Object
随着互联网的发展,越来越多的企业建立了网站系统以实现信息化、电子商务、形象宣传等。但在信息化高速发展的同时很多网站也存在着信息更新不及时、网站维护困难和访问速度不
步态识别是指通过人体走路的姿势来识别人的身份。近来年,步态识别作为一种生物特征识别技术而备受关注。步态识别的三大优势:远距离识别,非侵犯性和难于隐藏性,使得它可以广