【摘 要】
:
本文介绍了二维/三维克希霍夫时间偏移计算在GPU集群上的MPI/CUDA混合编程实现.系统的主体结构基于经典的主从模式,采用MPI进程-pthread线程-CUDA线程三个层次的并行架构
【机 构】
:
SupercomputingCenter,ComputerNetworkInformationCenter,ChineseAcademyofSciences,Beijing100190,China中国
【出 处】
:
第二届中国科学院超级计算应用大会(SCA2012)
论文部分内容阅读
本文介绍了二维/三维克希霍夫时间偏移计算在GPU集群上的MPI/CUDA混合编程实现.系统的主体结构基于经典的主从模式,采用MPI进程-pthread线程-CUDA线程三个层次的并行架构,以及CPU/GPU协同计算并行架构和策略来设计实现.每个计算节点由一个多核CPU和多个GPU设备组成.输入数据在主节点上载入,平均分配到从节点上,存储到相应的磁盘空间内,并根据各节点的可用资源将数据划分为多块.每个从节点分别接收主节点发送的数据并存储到本地磁盘上的临时文件内.根据检测到的可用GPU设备数,每个从节点上创建同样数目的线程来一对一控制各个GPU.各从节点上每个数据块再进一步划分为大小相等的块一一分配给各个线程,由每个线程逐道在CPU上预处理后传送到GPU上处理,道内的各成像点分别由各CUDA线程并行处理.每个数据块偏移由每个线程内的相关道累加计算而得,结果返回到主节点上累加后输出到磁盘文件内.在实现过程中,采用CPU/GPU协同计算以及线性插值走时的方式来进一步提高性能.系统性能在一典型异构GPU集群上测试,每个节点由一个配置8GB内存的四核CPU,以及配置6GB显存的C1060型号的GPU组成.对于不同的规模和积分计算模式,在该平台上的测试结果表明,本文实现的系统的性能对于包含相同计算节点数、每个节点上4个线程并行计算的MPI版本,可以达到平均约5~10倍的加速.
其他文献
本文通过化学气相沉积方法得到了Pb/ZnO核壳结构纳米线,然后采用高分辨率的透射电子显微镜对其核壳结构和成分进行了分析。
本文将透射电子显微镜加速电压调为为200 kV,然后使电子束会聚在镁合金的基底镁上面打出大小为3-8 nm的孔洞;接着,散开电子束,利用原位高分辨透射电子显微技术作用在孔洞上,发
本文将EBSD(electron back-scattering diffraction)与FIB两项技术连用,克服了菊池线标定的不唯一性,成功地制备了Bi2Te3(110)截面TEM样品。
采用高分辨电镜(HREM)对Mg-Gd-Y-Nd-Zr(EW75)镁合金峰时效态的沉淀析出相β相进行了研究,分析了β相在峰时效不同阶段的电子显微特征。
本文利用自主研发的扫描电子显微镜和扫描探针显微镜联合测试系统,探讨了针对一维纳米材料的原位三点弯曲纳米力学实验定量的测试方法和技术。
本文利用电子显微技术,通过高角暗场像与环形明场像,在原子尺度实现对锂离子的直接观测,对研究锂离子电池结构表征起到了重要的作用。
本文主要阐述当前初中物理在“科学方法”教与学中的冲突、困惑,主要包括:一、真实中的“谎言”,学生难辨真假;“谎言”中的真实,学生违心妥协。科学方法的核心是世界观。在三
本文以《探究产生感应电流的条件》为例,探讨了同课异构条件下高中物理六个教学引入片段的赏析,主要包括:微电流传感器辅助摇绳发电游戏导入、实物投影辅助摇绳发电导入、实
本文就如何使中学物理教学在现有的结构下更贴近学生实际、贴近学生成长、贴近学生科学素质养成,从认知、思维、局限和探究等几个方面探讨了笔者的实践认识。
径向基函数广泛应用于网格变形、气动外形优化设计、网格优化等领域。近年来,基于径向基函数的动网格技术得到了深入的研究和广泛的应用。本文结合计算流体力学和高性能计