气象学应用在鲲鹏集群上的移植及性能优化研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:feiyang_520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以Intel为首的X86架构处理器凭借着通用性强且性能高的优势在高性能计算领域领跑多年,但是功耗控制问题成为制约其发展的主要挑战。随着近些年数据爆发式的增长,一些经典的高性能计算场景如气象预测急需更高功效的计算资源开展高分辨率和高精度研究。2020年,基于ARM架构处理器的日本Fugaku超算集群在全球超算Top500榜上排名第一,高性能、低功耗的ARM架构未来有望在高性能计算领域拥有更广阔的应用前景。目前,全球ARM芯片领域以华为、Marvell、飞腾、富士通四大厂商为主,研发出的Thunder X2、鲲鹏920、FT-1500A、A64FX等处理器能效比均优于X86处理器,华为更是基于鲲鹏架构开发出了全栈的软硬件产品。但ARM处理器精简指令架构与X86复杂指令集并不兼容,众多高性能软件如何向ARM架构平台迁移并提高性能成为当前研究者们面临的难题。此外,气象数值预报研发也需要加大低功耗、高性能CPU技术的应用力度,以便最大化利用未来高效体系架构的高性能计算平台。针对上述问题,本文研究高性能气象学数值模拟中应用最为广泛的WRF、CESM、NEMO三款软件在华为鲲鹏920处理器及全栈软硬件系统上的移植和优化问题,探索它们在不同编译环境、并行计算库和操作系统下的计算性能以及优化方法。首先本文对三款应用进行运算性能特征提取分析,梳理出三款软件对鲲鹏920运算环境的特定需求和可移植性。其次,对于不同的软件,本文提出了基于GCC编译器+Open MPI通信库、毕昇编译器+Hyper MPI通信库的移植方案。结合软硬件特性分析移植过程出现的问题,并在编译级和运行级通过编译参数、性能加速库、绑定进程与线程等方法对三款软件进行性能优化。最后,本文利用不同规模的算例及NCL可视化工具验证了移植优化后软件在鲲鹏平台上的模拟结果准确性,同时分析和评估了三款软件在Intel X86架构、AMD X86架构、鲲鹏open Euler平台以及鲲鹏Centos平台上的性能差异。从本文研究结果来看,WRF、CESM、NEMO三款软件均为计算密集型应用,它们拥有良好的并行扩展性且对计算核心数目和内存带宽有着更多的需求,更加适合在鲲鹏集群上运行。同时,本文提出的两种基于不同编译器和通信库的移植方案能够解决鲲鹏架构兼容性问题,提出的优化方法也在一定程度上缓解了集群节点间通信延迟问题。相较于Intel X86 6248 CPU集群和AMD EPTC A320-G30CPU集群,Centos系统下基于GCC编译器+Open MPI通信库移植优化后的WRF模式在鲲鹏平台上的计算速率最多能达到43.57%的提升,基于鲲鹏全栈体系移植优化的CESM系统能达到40.99%的效率提升,基于不同编译方案移植的NEMO在鲲鹏架构上也表现出了稳定的运算性能和并行扩展性。此外,不同尺度的三个算例NCL可视化显示,鲲鹏架构与X86架构模拟预测结果一致,同时本文分析发现鲲鹏Hyper MPI在多节点通信存在热点函数占比不均衡问题。基于本文实验结果及移植方案,不仅可以给气象学领域的研究者在鲲鹏架构上开展相关模拟提供性能参考,同时也为华为高性能计算软件生态进一步的发展提供借鉴。
其他文献
本文主要围绕傅增湘的金石活动与其书法为中心展开,通过他与金石书画家的交游、访碑、鉴藏、传拓等活动进行考察,最后再描写其书法作品并探讨其书法风貌的变化及原因。论文主要分为四部分。首先,第一部分简单介绍了傅增湘家世及生平,分别论述傅增湘与金石学家、书画家、篆刻家的交游。其友罗振玉、沈曾植、张元济、王国维等人的金石鉴赏观都或多或少对傅增湘的思想产生了影响,相互的交游中蕴含着傅增湘的“嗜古”思想。其次,第
学位
拐卖儿童犯罪严重侵害了儿童的身心健康与人格尊严,给家庭和社会带来重大创伤。在社会经济快速发展的今天,由于暴利因素与买方市场扩张导致拐卖儿童犯罪仍屡禁不止。中国环境犯罪学研究起步较晚,且主要针对的犯罪类型较为集中,当前亟需从精细化的空间视角针对不同犯罪类型展开实证解析。因此本文从微观街区尺度聚焦拐卖儿童犯罪问题,基于网络寻亲数据、视频监控数据与实地调研资料,采用质性分析、数理统计、空间计量等方法,综
学位
在新时代背景下,随着全国各类马拉松赛事举办场次增多和规模不断扩大,马拉松裁判团队执裁素质和管理水平等方面暴露出诸多问题。本文在了解广州马拉松裁判员团队发展现状的基础上,初步构建了广州马拉松裁判员执裁胜任力模型,以期为广州马拉松裁判员的个人提升与团队专业化建设提供理论参考,同时也为今后我国马拉松裁判员选派、岗位培训、职业发展等方面提供标准与依据。本文综合运用了文献资料法、专家访谈法、数理统计法、问卷
学位
作为第二代电网系统,智能电网是一种集合了电网技术与信息技术的典型信息物理系统,但由于其规模大、结构复杂,智能电网极易受到攻击影响。智能电网的信息系统主要负责电能分配与信息交流,因此它在系统中处于关键作用,一旦攻击者成功对其实施攻击,将对智能电网造成不可逆的影响。由于传统电网的交流性质,针对交流电网的攻击检测研究已经有了较大进展,但对直流电网的攻击检测研究还相对较少。为此,对本文基于强化学习的算法,
学位
在整个西方哲学的历史上,有关指称问题的讨论一直是语言哲学的核心话题,也是讨论语言如何与世界相连接的焦点。随着现代认知哲学的发展,人们开始通过对语言的研究来澄清传统哲学提出的形而上学问题。但是有关空名问题,尤其是那些非实存对象的指称问题逐渐进入到人们的研究视野,并呈现出多学科、多视角的多元化研究局面。塞恩斯伯里通过对于指称理论的历史考察,在穆勒的直接指称理论和弗雷格的描述理论之间,找到了第三条道路。
学位
云南的傈僳族是一个有着悠久历史,在得天独厚的地理环境和独特的人文中孕育出了一些民族传统体育项目,而传统体育作为傈僳族的民族文化内容,是一种不可再生的文化,需要人们的高度重视,如果不对其采取合理的保护措施,这种少数民族传统体育文化会慢慢的被人们遗忘。从以前发展到现在,最能够体现出傈僳族传统文化的传统体育项目就是射弩,射弩作为傈僳族智慧的结晶,也是傈僳族民族文化发展的见证,蕴含着傈僳族人民丰富的精神文
学位
十八届三中全会以来,推进国家治理体系和国家治理能力建设作为一项重大战略任务日渐提上我国政府现代化建设的日程,基层政府治理作为国家治理体系的重要组成部分,直接关系到国家治理成果的最终呈现。十九届四中全会对国家治理能力和治理体系的显著优势进行了总结升华。形式主义作为一个长期存在于我国政府建设过程中的具体问题,影响了基层治理效能的发挥。十八大以来,习近平总书记曾多次强调要反对形式主义,加强四风建设。党中
学位
当今社会中,人们的日常生活方式及其物质精神等选择日新月异。文字、图片、影像等各种视觉符号,都能够对社会的发展具有极强的直接或潜在的影响。单就影像艺术而言,到了当代,影像艺术已经历了从单一的影像到拟像过程的叙述转变,其中包括了电子技术时代的视觉影像及其他数字技术阶段。影像艺术这种前进并不单纯是后者对前者所进行的全面性取代,更多的是后者作为前者的多向递进式补充。随着当代各个阶段的数字媒体和电子传播媒体
学位
随着汽车工业的逐渐发展,我国废弃的轮胎规模也越来越庞大,不仅造成了资源浪费,还产生了严重的黑色污染。如何绿色高效的回收废旧轮胎,已经成为我国在建设资源节约型社会的道路上一个亟待解决的问题。将废旧轮胎进行热裂解处理是一种环境友好型的处理方式,其不仅解决了废旧轮胎的处置问题,还可以产出固、液、气三种形态的有价值的产物,其中固体产物约占产物总量的35-45 wt.%,被称为废旧轮胎再生炭黑,简称为rCB
学位
随着高性能计算解决的问题不断增多,对计算架构多样性的需求也在不断增加。2019年,华为推出了首个基于ARM架构的国产处理器鲲鹏920,它高性能、高吞吐、高集成和高能效的优势可以为更多的企业和研究机构构建高性能、低功耗的新计算平台。面对高性能计算应用性能的挑战,除了可靠的硬件还需要依赖高性能的软件如编译器、数学库、MPI通信库等,尤其是线性代数库。线性代数中的对称矩阵方程求解问题常出现在工程领域,如
学位