基于异构众核处理器的有限差分算法并行优化

来源 :江南大学 | 被引量 : 0次 | 上传用户:xinduolian1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有限差分算法一直都是偏微分求解过程中的核心求解方法,但是在面对大规模科学计算应用时,普通处理器的计算效率难以满足应用的需求。“神威·太湖之光”超级计算系统,是世界上第一个性能超过100Pflop/s的超级计算机系统,内部集成了40960个申威26010异构众核处理器。申威26010异构众核处理器具有独特的系统架构。目前,针对有限差分算法的计算,还没有一种优化方案可以完全发挥申威26010异构众核处理器高超的计算性能。为了提高有限差分法求解的效率,本文基于“神威·太湖之光”超级计算机系统,针对地震波正演模拟与通用地球系统模式中以有限差分法为核心计算函数,存在并行效率过低的问题,设计出了多种多级异构并行优化方案。本文根据申威26010异构处理器的架构特点,分析“神威·太湖之光”超级计算系统在处理有限差分算法相关的密集型算法时的主要性能瓶颈。研究了基于“神威·太湖之光”超级计算系统上的有限差分方法的多级并行优化。针对并行过程中出呈现的MPI消息传递效率低、处理器带宽造成通信效率低下、处理大规模数据LDM空间无法满足计算需求等问题,研究了MPI、Sunway Athread、SIMD向量化等并行方法,设计出纵向数据划分、链式通信、2.5-D流水线、捆绑通信、异步通信等多级异构并行优化策略。主要的优化工作如下:(1)地震波有限差分法交错网格格式两级并行优化方案。针对一级并行中MPI消息传递耗时的问题,重新划分了数据的分配方案,有效的减少了消息传递的次数,提高了一级并行的并行效率。同时,通过二级并行策略,有效缓解了一级并行方案中呈现出内存占用过大导致无法计算大规模模型的问题。二级并行中因处理器访问主存带宽的限制,导致数据访问延迟,造成计算核心无法发挥其高效的计算性能。因此,通过神威内部线程库使用DMA通信的方式,将数据从主存加载到计算核心局部存储器(LDM)中。为了使DMA发挥其最大性能,本文设计出链式读取数据的策略,但当数据增加到三维,LDM存储空间难以满足计算的需求,因此本文提出了2.5-D流水线法,缓解了数据存储压力,同时2.5-D流水线也方便方便了异步通信方案的实施。在地震声波正演中使用128进程8192线程进行多级异构并行性能测试,结果显示较优化前取得了1250.97倍的加速效果。(2)通用地球系统模式中有限差分相关函数的多级并行优化方案。在之前的优化策略上,增加向量化级别并行进一步提高了并行效率。深入研究处理器内部寄存器通道,设计出捆绑通信策略。该策略有效缓解通信优先策略与存储优先策略之间的冲突。向量化级别并行中,研究了vshff数据置换方式,减少向量数据封装过程中的消耗。在单个核组内对两个以有限差分为核心计算的函数进行并行性能测试,分别取得了9.9倍和21.2倍的加速。综合以上两项工作中的优化策略,本文主要研究了以有限差分法为代表的密集型算法在“神威·太湖之光”超级计算机系统上的并行优化。从测试的结果显示,本文提出的多种并行策略,有效缓解了因硬件设计造成的带宽瓶颈,并取得了理想的加速效果,为以后其他算法在神威上的移植奠定了基础。
其他文献
温度(T)的测定在科学和工业领域都很重要。一般情况下,传统的接触式测温技术需要传感器与物体之间的热传递并达到热平衡。但是这种测温方式通常需要很长的时间,这可能会改变样
近年来,安全关键系统在汽车、航空航天和能源等行业得到广泛应用,这些系统对可靠性有非常高的要求。冗余技术的大量应用给系统带来高可靠性的同时,也增加了系统结构的复杂度。复杂系统的可靠性分析面临着认知不确定性、动态故障行为和共因失效等挑战。如何在这些因素的影响下对系统进行可靠性分析并制定相应的维修策略,具有极为重要的意义。首先,针对系统动态故障行为,采用动态故障树进行建模。针对复杂系统中采用大量冗余技术
由于其可控的环境响应性,刺激响应性聚合物在各个领域被广泛地研究和应用,这些应用极大地促进了刺激响应聚合物型先进功能材料的发展,同时对其智能性能提出了更高的要求。由
海月构造带位于辽河滩海中部地区,东西两侧紧邻盖州滩及海南生油洼陷,具有两洼夹一隆的特点,油气成藏条件有利。本文开展了海月构造带古近系层序地层划分、沉积体系分析、滩
布料是所有箱包制造企业生产产品的原材料,也是箱包材料销售档口主要出售材料。伴随互联网+的推进和提升企业的生产效率的需要,箱包制造企业迫切希望通过在设计产品时提供的
当下全球环境和能源问题备受人类关注。过度使用化石燃料不但造成空气的污染,而且使全球气候变暖更加严峻。因此,全球科学家将主要工作致力于开发和使用清洁、高效、可持续的
花球啦啦操运动员技术能力的强弱,直接决定了其整体运动技术水平的高低,对其运动竞赛成绩也会产生显著影响。当前,受国际花球啦啦操盛行的趋势影响,我国花球啦啦操运动的发展
产融结合是实体产业和金融行业为了更好的发展而进行的相互渗透和内在融合。根据数据显示,世界500强中几乎80%的企业都采用了该模式,它已经成为企业实现跨层次发展的必经之路
2020年是5G大规模商用元年,其中的远程医疗保健,AR/VR,自动驾驶以及其他的创新服务使得我们的生活会发生翻天覆地的变化。天线作为整个通信系统的核心部件,对整个网络的质量
对生产和生活中的气体进行检测对人们的生命财产安全、工业发展和环境保护方面都具有重大意义,很多重大的安全事故都是由于未能及时精确地对有害气体进行检测所导致的。随着