高超声速流场GPU并行算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xinxinrenren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年CFD技术的进步很快,其应用范围也越来越广,计算网格量剧增,少则上百万,多则以千万计、以亿计,巨大的计算量给当前以CPU为计算核心的并行计算集群带来了巨大的压力,而以GPU为计算核心可以很好的解决这个问题。本文针对CUDA平台进行了CFD数值模拟的实现,并分析了针对基于CUDA架构的CFD程序进行优化的特点以及不同数值格式在CUDA平台中的收益。本文针对英伟达公司提出的CUDA平台进行了基础性的介绍,它在硬件层次上可分为流处理器阵列和存储器系统,在软件层次上主要是内核函数的线程结构,指出了它与CPU架构的不同点。然后列举了不同的并行模式,重点介绍了CUDA架构的并行模式——单指令多线程模型,分析了它与传统并行模式的异同。针对一维激波管问题和二维双马赫反射问题,采用WENO5阶格式在CUDA架构上进行计算。分别阐述其实现过程,其中包括数据结构、数据通信以及内核函数的执行配置。在一维问题中,从数值上分析基于CUDA的CFD并行算法的准确性,并重点的分析了其单精度算法与双精度算法的差距,然后分析了各自的加速比;在二维问题中,重点从流场结构中去分析程序的准确性,结果表明无论是单精度还是双精度的CUDA算法都可以很好的刻画流场结构,且都有较高的加速比。针对基于CUDA的二维WENO5程序从三个方面进行优化,分别是最大化利用率、最大化存储器通信量、最大化指令吞吐量。在最大化利用率方面分别采取流的方式和提高资源占有率的方式;在最大存储器吞吐量方面分别采取了设备存储器的优化和共享存储器的优化;在最大化指令吞吐量方面主要是算术指令和控制流指令的优化。针对不同的CFD数值格式,分别采用CUDA架构去实现。基于二维双马赫反射问题分别采用Steger-Warming分裂格式、Roe格式、AUSMPW+格式在CUDA中实现,并与WENO5的格式进行了对比,比较了它们的加速比,分析针对不同的格式有不同的加速比的原因。
其他文献
介绍丫髻沙大桥主桥钢管混凝土拱桥主拱拱肋钢管桁架的节点设计.
摘 要:《松鼠葡萄》壶纯净细腻的色调告诉我们,这是一把值得体会和品位的好壶,形成了别具一格的艺术风格。欣赏这把壶,会不知不觉地神游到当时的趣味之境里,我们能“闻”到清新的空气,能看到绿树成荫、硕果累累,能感觉到大自然对人类的恩惠和厚爱。  关键词:紫砂;松鼠葡萄壶;造型;艺术  1 前言  神奇的大自然,蕴藏着无穷的奥秘,有待我们去探索,去了解。人类社会起源的密码,把地球与人类的发展关系揭示出来,
当今时代,是信息化时代.课件的制作是信息化时代多媒体计算机技术与教育结合的一个产物,是实现教育信息化的一种重要途径,它被广泛应用于教学、科研、商务办公、宣传、会议等
论述了深孔挤压爆破筑堆工艺中的爆破作用机理,并通过常规爆破矿石的室内高柱浸出和挤压爆破的原地爆破浸出矿石块度分布、各粒级品位、各粒级浸出率的对比分析,从理论到实践上
本文主要以宽体窑新型天然气喷枪的结构及特点、新型天然气喷枪节能效果分析、新型天然气喷枪应用于陶瓷生产中的优势等方面阐述了新型喷枪的价值.重点以某企业生产全抛釉为
依据西南铁路铁峪铺车站取土场的爆破,对洞室法松动控制爆破进行分析和总结.
根据18倒乳腺癌根治术的具体情况,提出临床问题,进行文献检索,将实证与患者实际情况,病房实际人力,物力资源,制订切实可行的护理计划。经过循证护理,为乳腺癌病人提供全面、优质、个
颈椎后纵韧带骨化(简称OPLL),是因颈椎后纵韧带内钙质沉着、骨化所致,并在椎管内形成狭窄,从而压迫脊髓或神经根,造成一系列临床症状。
目的探讨在我院检测甲胎蛋白(AVP)对诊断原发性肝细胞癌(HCC)的阳性预测值。方法采用回顾性分析的研究方法.对2006年我院住院病人中既做甲胎蛋白(AFP)检测又行肝穿的病例资料进行分
与其他股权类再融资方式相比,定向增发具有发行门槛低、审批简便、融资用途较广等诸多优势,经过十余年的发展,定向增发已成为我国规模最大的股权再融资方式。2019年我国开始