基于GPU计算平台的电磁散射计算并行加速技术

被引量 : 0次 | 上传用户:jxy_su261314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标电磁散射计算,尤其是电大目标雷达散射截面预估与逆合成孔径雷达成像,对于国防建设有着十分重要的意义,一直是计算电磁学的研究热点之一。但是在解决飞机、舰船等实际目标的高频电磁散射特性分析问题时,往往会遇到计算量巨大和硬件计算能力不足等难题。本文为解决目标电磁散射特性的快速计算问题,借鉴计算机图形学中快速射线追踪等技术,并利用图形处理器(GPU)的强大的并行数值计算能力,分别采用GPU、CPU-GPU异构架构和GPU集群三种计算平台对频域电磁计算方法进行并行加速。本文提出了基于统一计算设备架构(CUDA)的多分辨率弹跳射线法,该方法综合使用了弹跳射线法的两类加速算法。第一,通过采用多分辨率射线管,有效地减少了参与计算的射线管总数;第二,使用基于线索增强的无堆栈kd树遍历算法,大大减少了不必要的内部节点遍历,加速了单根射线与目标的求交。在GPU平台上,本文还基于CUDA对矩量法进行了加速。在阻抗矩阵填充过程中,通过应用不同的核函数分别计算奇异性元素与非奇异性元素,避免了CUDA对分支语句的序列化处理带来的效率下降。并且基于CUDA提供的基础线性代数运算库CUBLAS开发了稳定双共轭梯度法,提高了矩阵方程求解的计算效率。本文将弹跳射线法和截断—增量长度绕射系数映射到CPU-GPU异构架构上,高效地充分利用了所有可用计算资源。在该方法中,利用GPU强大的单精度浮点运算能力加速弹跳射线法,而考虑到截断—增量长度绕射系数对于数值精度相对较为敏感,选择在CPU上基于双精度浮点数对其进行实现。根据相邻角度计算负载和计算时间几乎相同这一事实,采用基于前一角度计算时间来调整当前角度负载分配的动态负载均衡算法,保证CPU与GPU之间的负载均衡。该方法提升了高频方法在目标成像等应用中的计算精度和效率。最后,本文还提出了基于GPU集群的并行弹跳射线法,该方法采用虚拟孔径面划分的并行策略,克服了基于角度的负载分配方案受GPU数量限制的不足。为保证GPU节点间的负载均衡,该方法并不依赖于各个计算节点计算能力相同这一假设,而是基于前一角度各节点的计算时间来动态调整当前角度下虚拟孔径面的划分,因此该方法也适用于配备不同GPU的异构GPU集群。本文结合使用图形学中的快速射线追踪技术,及GPU、CPU-GPU异构架构和GPU集群三种计算平台,对多种频域计算方法进行加速,有效地提升了电大目标电磁散射分析的精度与计算效率。
其他文献
古田会议是党的建设的一个重要里程碑。全面理解古田会议精神,既要基于当时的时代环境,把握古田会议的核心——思想建党,又要结合当前党建工作的时代命题,突出思想建党。新形
我国权威机构的最新抽样调查显示:农民工在我国二、三产业员工中所占比例已高达59.8%(具体分布情况为:建筑施工企业占6.7%,机械制造企业占11.1%,电器制造企业占10.3%,化工制
中国作为技术追赶型国家,政府惯常将R&D补贴作为激励企业进行自主创新的关键政策手段,但事实是企业经常发送虚假的"创新类型"信号以获取政府R&D补贴。本文建立了一个企业与R&
问责不能仅仅局限于重大灾难、伤亡事故的责任追究,理应包括行政官员的隐性失职、决策失误、用人失察和其他领域的问题与失误。
在数字阵列雷达系统的研制过程中,需要在不同的目标、干扰及噪声环境下对系统的数字波束形成(DBF)处理器和信号处理器的性能进行测试和验证。由于成本和实验条件的限制、天气
<正>制约跨境电商发展的瓶颈,既有政策层面的问题,也有技术层面的问题。安徽应一边争取国家试点支持,一边加强地方创新改革,鼓励在有条件的地方先行先试,逐步探索针对不同类
基本顶的初次破断规律多采用四边固支边界模型分析,但实际的岩层环境难以实现固支。为了研究基本顶实际围岩条件时的破断规律及破断条件,建立弹性基础边界条件弹性薄板力学模
在中国特色社会主义进入新时代的大背景下,海南自贸试验区(港)建设是习近平总书记亲自谋划、亲自部署、亲自推动的重大国家战略,必将对构建我国改革开放新格局产生重大而深远
上世纪80年代中期以来,不仅农民收入增长乏力,农村内部的收入不平等也在持续扩大。而在现有众多的研究农民收入不平等的文献中,农地制度对于农民收入不平等的影响在实证研究