SAR目标识别方法的GPU并行实现与优化

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:justmxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SAR目标识别方法已经成为近年来的研究热点,其研究成果被广泛应用于军事和民用领域。随着高分辨SAR成像技术的发展,SAR图像的分辨率和数据量均迅速增加,基于CPU串行计算的目标识别算法已经不能达到高分辨SAR目标识别软件实时处理数据的要求,且计算代价过高。而近些年出现的GPU(Graphic Process Unit)通用计算可以提供强大的计算能力和存储带宽,此外其具有开发成本低、周期短等优点。因此,基于GPU的并行目标识别算法的研究,对实时处理数据的目标识别软件系统的研究和建立具有重要推动作用。本文首先讨论了GPU的体系结构以及CUDA编程模型,并将目标识别算法分为特征提取部分和分类器部分,然后详细描述了如何将各部分的具体计算任务进行并行分解,以及如何通过CUDA并行编程实现各个计算任务,最终对CUDA程序进行一系列优化处理,争取实现算法的加速最大化。具体的工作安排如下:(1)分析了CUDA的编程模型、存储模型以及编程语言,然后研究主成分分析、非负矩阵分解和线性判别分析这三种比较成熟的特征提取技术和支持向量机这种分类方法的基础原理和实现方法,为后文目标识别算法并行分析提供理论依据和技术基础。(2)研究特征提取方法和分类器的计算任务,将计算过程拆分并做并行改进。分别对三种特征提取方法中的矩阵乘法、Jacobi迭代法求矩阵特征值、归约法、类间和类内散度矩阵构造等计算任务进行并行分析和GPU并行改进。然后分析SMO算法的计算过程和并行性,实现SVM在CUDA上的并行移植。最终,以MSTAR公开数据库为基础,通过实验得到目标识别算法在CPU端和GPU端的运行时间,并作对比分析,以证明GPU并行计算对目标识别算法的加速效果。(3)结合CUDA程序的通用评估方式和优化策略,深入分析了目标识别算法中影响CUDA程序运行速度的原因,实现了从通信、访存和指令流三个方面对算法进行优化处理。并通过实验表明基于GPU并行实现的目标识别算法经过优化获得了25-30倍的性能提升。
其他文献
雷达信号模拟器系统旨在重现真实的电子战争环境,模拟器将生成具有不同特性的雷达信号,并根据战场需要改变雷达信号模拟器的参数,从而实现多种信号形式,最大程度地为电子对抗
目标跟踪是指在连续的视频图像序列中,根据运动目标模板的某些特征,采用特定的度量方法,在每帧视频图像中搜索并依据一定的准则确定目标所在的位置和状态。本文在对多种目标跟踪
无线通信系统的干扰信号主要来自两方面:一是由于小区内空间复用引起的小区内用户间或者数据流间干扰;二是为了满足日益增加的数据业务需要而不断缩小小区覆盖范围而引起的小
随着嵌入式终端处理能力的增强,网络带宽的提高以及大数据处理分析水平的进步,移动互联网时代已经到来。无线传屏作为局域网中的移动应用,属于移动互联网的终端应用领域。采
近年来,随着科技的不断发展,各行业领域的生产管理逐渐向数字化、智能化的方向迈进,行业领域移动专网水平远不能满足现有行业应用的发展需要。基于TD-LTE技术的移动通信专网系统
协作中继技术能够有效地提高抗多径衰落性能和信道容量而受到了广泛的关注。近几年来,协作中继技术被广泛的应用到认知网络中以提高认知网络的性能,并且形成了一个新的研究方向
学位
随着驾驶辅助系统、机器人导航、虚拟现实等领域的迅速发展,空间位置信息吸引了越来越多的关注。双目立体视觉系统通过模仿人眼视觉系统,搜索目标在左右图像中的位置,根据三
视频由于其具有直观性、真实性、高效性及生动性等的特点,自视频技术诞生之日起,就一直受到人们的高度关注。但是由于视频文件所含的数据量非常大,在传输的同时还要求具有实时性
随着卫星技术的发展,卫星功能日益复杂化,星载系统对信息传输的可靠性提出了更高的要求。低密度奇偶校验码(LDPC)作为一种接近香农极限的信道编码,在星载系统中有强烈需求,但其应