粒子模拟下基于CUDA的GPU并行方法研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:ll730520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着高性能异构计算的快速发展,以GPU为代表的众核异构并行计算技术在科研领域开始广泛的应用,其独特的组织架构、强大的浮点计算能力和巨大的数据吞吐量,突破了传统的CPU计算摩尔定律的局限。在电磁粒子模拟仿真领域,时域有限差分方法具有高度并行性和计算密集性,且在电磁模拟计算中,计算过程尤其耗时,为了有效提高运算速度,缩短研发周期,本文的研究以三维粒子模拟软件CHIPIC-3D为基础,致力于在粒子模拟仿真计算中,将密集的电磁场迭代和粒子运动计算移植到CUDA,以CPU-GPU异构并行实现计算加速。CUDA并行移植过程遵循理论分析与编程实践相结合的原则。在深入理解GPU理论基础与硬件架构的基础上,以CUDA Fortran并行编程软件PGI Visual Fortran编译器为工具,实现了一维FDTD中心差分算法的并行计算,与单CPU串行程序相比获得最高10倍的计算加速;深入的理解了GPU并行计算优化的理论与方法,结合其共享内存、常量内存的使用,将计算进一步优化;在理论上分析了FDTD中心差分算法和时偏差分算法的并行性;分析了三维网格的划分与CUDA线程的映射关系,在CHIPIC-3D软件上实现了这两种算法的并行计算,以Tesla K40c系列GPU和Intel Xeon E5-1630系列CPU为硬件平台,对导体波导模型的仿真计算取得了最高10.4倍的计算加速,对冷腔返波管的仿真计算取得了8.8倍的计算加速,对冷腔返波管的仿真计算取得了11.2倍的计算加速;分析了CHIPIC程序粒子计算的串行程序,在CHIPIC-3D软件中部分实现了粒子的并行计算,以热腔返波管为算例,取得4.5倍的计算加速;分析了程序并行移植过程中遇到的问题和瓶颈,针对目前还未解决的问题提出了解决方案,为将来的研究打下基础。基于CUDA的GPU并行计算是首次在拥有自主知识产权的粒子模拟软件CHIPIC-3D上首次应用,且对热腔电子器件仿真有较好的加速比,未来将粒子计算部分进一步的优化,将会更加显著的提高计算加速比。
其他文献
为分析预测高速列车车内结构噪声,本文基于声固耦合理论,结合有限元法(FE)、统计能量分析法(SEA)的优点,采用FE-SEA混合法建立车体-车内声腔耦合车内结构噪声预测模型,分析在
依据深圳彩田路北延段工程新彩隧道北口段(拟建)近距离上跨厦深铁路梅林隧道两条隧道叠置的工程设计实例,运用有限元分析软件MIDAS-GTS进行三维模型数值分析,对比明挖暗埋法
<正>党的十九大报告提出,要深入挖掘中华优秀传统文化蕴含的思想观念、人文精神、道德规范,结合时代要求继承创新,让中华文化展现出永久魅力和时代风采。推动中华优秀传统文
<正>朗读技能是学好一门语言的基础。正确的朗读不仅有助于培养语感,提高记忆力,还有助于对知识的理解和积累,在教学过程中,教师要注意培养学生良好的英语朗读习惯。一、小学
虽说家家户户都有阳台,但每一户的阳台类型及日照、通风条件等都不尽相同。在种植花草之前,不妨先观察一下自家阳台的环境。尤其在都市,住家附近的整体环境,对阳台的日照、风
基于非阿贝尔SU(3)规范对称性的量子色动力学(QCD)是用来描述夸克和胶子之间强相互作用的动力学理论。QCD有两个重要的性质:色禁闭和渐近自由。由于色禁闭,通常情况下夸克和
随着我国社会主义市场经济体系的不断发展和完善,票据日益成为社会经济活动中不可或缺的金融工具各类票据纠纷也呈现出不断上升的趋势。《中华人民,共和国票据法》自1996年正
优秀的法律电影是一国法律文化的标本,足以反映一国的诉讼文化及诉讼心理。通过经典法律电影所折射出的中国民众的厌讼心理与西方民众的好讼心理之比较,我们获得了三点启示,
成都华栖云科技有限公司以&#39;创新智慧媒体服务云&#39;为参展口号盛装亮相BIRTV2019。华栖云围绕当前行业超高清、人工智能、5G等主流技术趋势,为广大参展客户现场展示公司
分析了微污染地表水源水厂通常采用的"常规+深度处理(臭氧生物活性炭)"工艺存在的生物安全性问题,并介绍了福山水厂采用前置"臭氧-生物活性炭"的常规+深度处理工艺特点,将砂