基于GPU的RRTMG_LW加速算法及其在地球系统模式中的应用

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:sundianjusdyg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算已经从最初提高中央处理器(CPU)主频率的方式发展成基于众核架构的并行计算方式。其中,GPU是众核架构的杰出代表。因为其优秀的并行计算性能和低功耗,所以越来越多的应用通过使用GPU得到了计算加速。作为大气环流模式一个比较重要的物理过程,辐射传输是计算密集型的,所以在辐射传输模拟中会消耗大量的计算资源。目前主流的辐射传输模式RRTMG在保证精确度的前提下大幅度减少了运算量,但是其依然占据物理过程25~35%的计算时间。同时,RRTMG辐射传输算法具有比较弱的数据依赖性。因此,为了进一步提高RRTMG的计算效率,非常有必要采用GPU技术来加速RRTMG。本文针对长波辐射模式RRTMG_LW主要开展以下两方面的工作:(1)分别提出了RRTMG_LW一维、二维和三维区域剖分GPU加速算法,并且基于CUDA Fortran实现了RRTMG_LW的GPU版本G-RRTMG_LW。在RRTMG_LW三维GPU加速算法中,针对子程序rtrnmc提出了“先并行,后累加”的加速方法,实现了rtrnmc并行算法的改进,提升了rtrnmc并行计算效率。实验结果表明,在单GPU上,与单CPU核心计算相比,RRTMG_LW最高实现了30.98倍的加速。(2)将G-RRTMG_LW成功应用到地球系统模式CAS-ESM中。针对大规模异构超级计算系统多节点多GPU的特性,基于MPI+CUDA Fortran混合编程模式提出了RRTMG_LW多节点多GPU加速算法,实现了CAS-ESM的快速计算。实验结果表明,在16个K20 GPU上,RRTMG_LW实现了78.12倍的加速。本文针对RRTMG_LW提出了一系列GPU加速算法,提高了长波辐射物理过程的计算效率,实现了CAS-ESM大规模高效异构计算,为其他物理过程异构计算算法的研究奠定了实践基础。
其他文献
污水中酚类化合物的测定,通常采用4—氨基安替比林比色法,是为常规方法,已有四十多年的历史。但是,在分析有色样品时易受到干扰。在对甲酚的分析中,显色反应要受到限制。此外
期刊
外观设计是富有美感并适于工业应用的新设计。作为具有独创性的艺术表达受到著作权法的保护,作为富有美感的工业设计得到专利法的保护,我国主要通过专利法保护外观设计。在我
演讲辞(演说辞、演讲稿、讲话稿)旨在表达感情,发表建议和主张,发出号召,提出倡议。演讲辞文本为演讲的内容和范围提供依据、规范和提示,它是口头语言和书面语言的有机综合体,而且具有可变性。一篇优秀的演讲辞兼具科学性与艺术性。它既是一篇优秀的论说文,又是优秀的文学作品。然而,演讲辞与其他的议论文或应用文不同。它有它独有的现实性、艺术表演性和鼓动性,语言简洁、严谨并给人以现实感。基于语文核心素养能力培养的
随着电视事业的迅猛发展和电视节目制作技术的日臻完善,电视节目的编排和包装越来越引起电视台的重视。人民群众对电视节目的需要不再单纯体现在量上,更多体现在对传播内容、品
目的探讨血糖升高对急性脑出血患者预后的影响。方法收集我院急性脑出血合并血糖升高患者87例(34例伴糖尿病),观察糖尿病患者与非糖尿病患者脑出血量、出血部位以及预后的关系
在日本作家中岛敦的小说《李陵》中,出现了李陵、司马迁、苏武三个主要人物,针对上述三个人物究竟谁才是小说真正的主角。承担了传达作者写作使命这一问题,学界长期以来仁智不一
盐酸表阿霉素(EPI)是一种广谱抗生素,为同类药物的首选,单一用药对多种肿瘤有抑制作用。目前临床使用的不足之处多为药物释放快、目标组织药物浓度低,静脉给药后分布体内各种