基于GPU加速的FDTD算法对电磁辐射与散射问题的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:mars1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时域有限差分法(Finite-Different Time-Domain Method)最早是由K.S.Yee在1966年提出的,是电磁计算领域的一种常用方法。在近几十年来,由于其独特的性能和优点得到了越来越广泛的应用和重视。然而,这种方法在进行空间网格离散化时,必须满足该算法稳定性条件和计算精度的需求,对于电大尺寸或复杂结构目标的电磁问题,会产生数量庞大的网格,单台PC机将很难提供足够的存储空间,且计算时间变长,计算性能降低。针对这些不足,并行FDTD算法可将大规模计算分割成小块来同时分别处理,既解决了内存不足又缩短了计算时间,从而为解决电大尺寸电磁问题提供了有效地方法。计算机图形处理器GPU(Graphic Process Units)将数据流并行处理的概念引入硬件结构中,具有高性能的数据并行处理能力,使其在通用计算领域的应用有着巨大的潜力。最新的通用计算GPU模型是统一计算架构CUDA(Compute Unified Device Architecture),它是NVIDIA公司的可编程多线程GPU提供的一种技术。CUDA可以为程序员提供充分调度数千个线程的能力。目前NVIDIA公司的GPU可以有效地支持数量巨大的线程,因此可以提高程序的性能达几个数量级。另一方面,由于FDTD算法在空间上具有天然的并行性,因此非常适合于在GPU上实现并行算法。本文针对传统FDTD算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于GPU加速的FDTD并行算法。同时,本文还对CUDA应用程序进行了优化,主要包括对数据访问的优化,这些数据访问主要包括对芯片上的几种内存空间,如共享内存、常量内存,以及寄存器。每个内存空间都有它们自己的性能特点和限制。本地内存和全局内存是没有缓存的,它们的访问时延很大。又由于共享内存具有写入块共享内存的数据可以被同一个块里的其他线程读取而不能被不同块的线程读取的特征,因此,共享内存可以在硬件中非常有效地实现所需要的快速内存访问。典型的CUDA操作顺序是:1)把任务分解为子任务2)把数据分解为小块,以使它们适合存储于寄存器和共享内存3)把数据块从全局内存中读出,并存储于寄存器和共享内存中4)用线程块处理每个数据块5)把结果拷贝回全局内存。因此,进行CUDA程序开发时面临的最重要的性能挑战之一就是如何充分地利用本地多处理器内存资源,合理地使用这些内存空间能够大大提高CUDA程序的性能。本文是在CUDA支持的NVIDIA GeForce 9800 GT上设计和实现的,该显卡具有112个流处理器和512MB的显存。我们在该硬件基础上研究了如何通过使用通用GPU处理器的并行结构来减少FDTD算法运行的计算时间。本篇论文的结构如下:在第二部分,主要阐述了FDTD算法的理论背景。在第三部分,阐述了GPU通用计算具体实现的现状。在第四部分,概述了GPGPU的CUDA结构模型以及如何具体实现基于GPU的并行FDTD算法。第五部分,描述了在CUDA编程模型上的FDTD算法的设计以及优化过程。第六部分,通过数值仿真实验以及结果证明,基于GPU的并行FDTD算法可以大大减少计算时间。本文介绍了在GPU上实现FDTD算法的细粒度的并行计算,并通过仿真及结果分析说明,使用GPU加速已成为电磁场数值计算的研究热点之一。
其他文献
舰船弹库中存放有大量不同种类的导弹,如各种反舰导弹、防空导弹等,因此弹库的安全性直接影响到舰船生命力。当弹库出现导弹发动机意外点火或爆炸等险情时,弹库及相邻舱室的安全
股权激励作为一种先进的激励方式,能够使管理层的利益和企业的长期利益结合起来,并能有效地降低代理成本。自2006年1月4日证监会《上市公司股权激励管理办法(试行)》(以下简
壳体组合结构是水下航行器的重要结构形式,对其振动噪声进行准确有效的预报不仅可对结构特性进行评估,还可以发现引起振动的关键因素,为结构声学设计提供改进的参考。结构振动噪
随着业务规模和领域的不断拓展.担保公司急需建立一整套的风险管理机制。风险控制不仅仅停留在业务承做和运营的过程中,而且体现在对于出险项目如何化解的后续不良资产的经营
<正>充换电设施是电动汽车普及和商业化运营的前提与基础。本文详细介绍了电动汽车充换电设施类型,对比分析了不同充换电类型的特点,依据各自特点建立了充换电站综合规划模型
一直以来扩展卡尔曼滤波(EKF—Extended Kalman Filter)转速估计方法凭借方法简单、可实现性强、快速收敛、抗噪能力强等优点成为异步电机转速估计方法研究的焦点。通常EKF转
基于该学院本科课程设置的缺点和培养宽口径电气工程技术人才的要求,并针对低年级本科生的需要,开设了一个以传统继电接触式电气控制为核心的少学时“电机与电气控制”实验课
近年来,中国体育消费不断升级,受国内资本频频青睐,互联网巨头相继涉足,腾讯早在15年前便开始布局,如今已成为掌握赛事运营领域最重要话语权的“玩家”之一。本文通过对腾讯
随着统计信号处理技术的不断发展,非线性滤波问题受到越来越广泛的关注,其基本任务是从受噪声污染的观测量中递推地估计不可观测的系统状态。粒子滤波是近年发展起来的一种非
钢-钢筋混凝土联合内支撑体系是由排桩、钢筋混凝土支撑和钢支撑组成的复合基坑支护体系。随着城市发展,该体系广泛应用于对变形控制要求较高的地铁车站等基坑工程,但桩撑支护体系的设计理论还不完善,该体系在施工全过程中的内力、变形规律有待深入研究。本文采用现场监测、理论分析和数值计算相结合的方法,研究钢-钢筋混凝土联合内支撑体系施工全过程中的内力、变形,分析排桩和钢-钢筋混凝土联合内支撑的工作性状;计算支护