论文部分内容阅读
综合孔径雷达(Synthetic Aperture Radar, SAR)技术近几年有了很快的发展,更高的分辨率以及更大的照射范围都使地面处理系统面临着越来越庞大的数据量,与此同时,对于SAR数据处理的性能和效率的要求也在同时变得更加严格。因此,人们对于SAR快速甚至实时成像系统的研究也越来越深入,各种高性能计算的平台和方法越来越多地被运用到SAR成像系统中去。在现有的快速SAR成像方法中,利用图形处理器加速的例子非常多见。传统的基于GPU的快速SAR成像方法中,GPU由于自身的超多线程、大规模并行的模式,而被用作SAR成像系统中主要的计算处理器,承担算法中主要的甚至所有的计算工作,与此同时,中央处理器(Central Processing Unit, CPU)只被用来承担一些算法实现过程中辅助性的工作,比如数据的读取与存盘(Input/Output, I/O),流程控制等工作。因此,传统的基于GPU的快速SAR成像方法中,CPU的计算资源和计算能力是被低估甚至忽略的。本文设计了一种基于深度CPU/GPU异构协同并行计算的快速SAR成像方法。通过面向异构协同并行计算的合理分块以及任务调度策略,整个成像算法可以部署到CPU和GPU上协同并行实现。部署在CPU上的并行任务,本文首次在多核CPU的基础上引入基于单指令多数据(SingleInstruction Multiple Data, SIMD)架构的高级矢量扩展指令集(Advanced Vector Extensions, AVX)来进行深度的并行优化。部署在GPU上的并行任务部分,借助英伟达(NVIDIA)的统一计算设备架构,本文解决了现有的基于GPU实现的快速SAR成像方法面临的两个问题,其一是有限的显存对SAR回波数据量的限制;其二是避免了现有方法中过于频繁的设备和主机之间的内存拷贝行为。在此基础上还运用了很丰富的优化策略,比如流技术,并行流水线等。实验结果表明,与基于单核CPU的SAR成像算法相比,本文提出的这种深度CPU/GPU异构协同并行计算的快速SAR成像方法比起经典的单核CPU实现的SAR成像算法可以提高大约270倍的运行效率。基于这种方法的SAR数据处理的效率远高于SAR数据生成的效率,所以可以说这种方法实现了SAR的实时成像。