论文部分内容阅读
雷达的研究和设计中需要大量的杂波数据进行分析,但一直使用实测杂波数据会消耗大量的人力、物力,影响现代雷达的研究进程。基于统计模型的杂波模拟方法可以在更短时间内获得杂波数据,使得杂波模拟成为一个重要的研究方向。零记忆非线性变换法(ZMNL)和球不变随机过程法(SIRP)是基于统计模型杂波模拟的两种主要方法,在模拟杂波数据时被广泛使用。随着现代雷达研究的不断发展,雷达探测的精度与广度不断提升,意味着雷达一次性接收的数据大量增加。基于传统的CPU杂波模拟方法已经不能满足现代雷达对杂波数据的实时性要求,对杂波模拟方法的高性能实现是需要迫切解决的问题。根据目前高性能计算平台中CPU-GPU异构系统的研究分析,本文使用CPU-GPU异构平台对杂波模拟方法ZMNL和SIRP方法进行并行策略的研究,并在实验中分析优化效果。本文分析了ZMNL方法和SIRP方法在实时性方面的瓶颈问题,并针对两种方法的计算特性,使用CUDA从指令集、共享内存、卷积计算等方面对ZMNL方法进行细粒度优化,得到ZMNL-CU方法。从积分计算、任务调度方面对SIRP方法进行粗粒度优化,得到SIRP-CU方法。最后参考实际雷达参数对两种方法的优化效果进行实验分析。本文针对ZMNL方法中卷积计算耗时问题,提出了一种基于cu BLAS的矩阵可变维度卷积算法—Conv C,并与直接卷积方法、gemm矩阵相乘卷积法、快速傅里叶变换(FFT)卷积方法在多个高性能平台上进行实验对比。实验结果显示Conv C方法相较于其他卷积方法在数据量较大时均具有更显著的计算性能。最后本文针对SIRP方法中CPU-GPU异构平台负载不均衡问题,提出了一种基于Open MP+CUDA的粗粒度任务流并行模型,并推导出模型计算效率评价函数,最后通过实验分析计算效率提升效果。分析两种方法在实验中取得的优化效果,ZMNL-CU方法相较于CPU获得了41倍的加速比,相比于传统GPU优化方法性能提升了近两倍。SIRP-CU方法相较于CPU计算获得了108倍的加速比,并相比传统GPU优化方法提高了近61%的计算效率。