面向众核处理器的Stencil计算性能分析和优化关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:cyc528528
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算一直是各个主要国家争夺的科技制高点之一,基于X86架构或者GPU构建超级计算机一直是科研人员的首选。2020年6月,日本基于ARM架构建造的超级计算机Fugaku登上TOP-500的榜首,ARM高性能处理器引起了从业人员的广泛关注。然而基于ARM架构的程序优化技术并不如在X86处理器和GPU上性能优化技术成熟,处于刚刚起步阶段。本文以模版计算Stencil为例,在FT-2000+众核处理器上开展面向ARM架构的并行程序优化技术研究,包括面向单核处理器的性能优化技术、面向NUMA架构的多级并行优化技术和基于数据访问的性能分析预测模型。针对Stencil计算在FT-2000+处理器上单核性能优化问题,从算法结构、数据局部性、向量化、数据布局转换等多个角度进行性能优化。针对访存密集的算法结构,采用了减少非计算开销、减少冗余计算、减少数据访问足迹、增加计算强度等技术提升性能。局部性优化方面,采用空间分块提升了高速缓存的重用。为了利用向量处理单元,我们采用内联函数和内联汇编的方式实现Stencil计算,并结合存储资源和指令执行周期进行了指令编排,以最大限度隐藏访存时延。此外,针对实验平台存在的非对齐加载问题,提出数据布局转换技术以消除上述问题带来的额外数据访问开销,进一步提升性能。实验结果表明,对于3D Stencil计算,上述方法平均提升浮点性能41%以上,组合优化策略下最好情况达到167%。针对Stencil计算在FT-2000+处理器上的众核性能优化问题,提出了虚拟多核CPU的解决方案,采用Open MP+MPI的混合编程方法,提升Stencil计算的性能。针对众核下数据块划分带来的通信开销,提出了切割最外层循环的分块改进方案。实验结果表明,相对于单核实现,性能提高了50.00倍,相对于纯Open MP实现,性能提升了6.27倍。最后,针对内存层次架构和Stencil计算模式,从量化数据访问开销的角度,建立了ERCM静态分析模型,给出了程序执行时间的预测,为程序优化过程提供了参考。本文针对空间分块技术建立了一个基于ERCM的性能分析模型,对于给定的体系结构和Stencil计算模式,可以给出较优的分块大小参数,避免耗时的穷举搜索。实验结果表明模型对3D blocking Stencil算法的性能预测精度达到90%以上。更近一步,我们利用ARM平台的Performance Monitor Unit单元,查看程序执行过程中的缓存缺失率等关键指标对性能分析模型的有效性进行了双重验证。
其他文献
在城市不断发展、户外空间缺乏重视的大背景下,城市微气候逐渐恶化,户外热环境的舒适性降低。校园人员密度大、活动复杂,其户外环境的舒适性直接影响到师生的日常活动和教学活动。因此文章以北方某高校校园为研究对象,通过实地测试和问卷调查,分析了高温天气下大学校园室外热环境状况及学生舒适性,同时构建校园三维建筑模型,利用ENVI-met软件,分别针对不同规划设计要素进行室外热环境模拟,得出室外热环境的优化设计
学位
知识经济时代,市场环境愈发复杂多变,竞争日益加剧。当下,科技创新便是经济社会发展的关键突破口,在宏观层面上处于国家发展战略的重心,且在组织层面上发掘新的利益增长点,产品、服务和技术的可持续创新能力成为企业在市场竞争中获得优势的关键。科技人才的创新实践与成果即创新绩效是创新的结果呈现,也代表了创新能力效率和水平。科技创新是人力物力财力投入高且在过程和结果中不确定性因素多的探索性、创造性活动,嵌套于环
学位
装备是作战中不可或缺的物质支撑,随着高新技术手段在军事上的不断应用及创新,现代信息化、智能化作战趋向于无接触式、远程式的打击作战,装备及对装备的使用在这一作战进程中发挥着重要的作用。与此同时,作战中的各类装备知识内容、数据量严重过载,从事装备研究、使用等人员难以从装备知识数据中直观获取关键知识,缺乏有效手段对装备知识进行梳理以便于相关人员对其高效理解、掌握乃至于运用。知识图谱(Knowledge
学位
在全面实施乡村振兴战略的总要求下,提升乡村治理能力是加快构建国家现代治理体系的坚实基础,是推进农业农村现代化的必由之路。与经济欠发达地区相比而言,经济发达地区具备更为丰富的资源要素禀赋基础,乡村治理机制更为完善,有必要进行经验总结并逐步推广至全国层面,促进落后地区乡村治理有效早日实现。作为沿海的经济发达地区,晋江市乡村治理成效十分显著,为全国贡献了晋江智慧,因此对其展开乡村治理能力的检视与分析具有
学位
视线交互技术实现了眼动控制计算机的功能,具有解放双手、传输高效和交互自然等优势,应用前景十分广阔。目标选取操作是视线交互的一个基础操作过程,操作者通过视线驱动光标完成对目标的定位和激活。以往大量研究通过考察视线目标选取操作的影响因素来探索该过程的操作规律和特点。相关研究可归纳为自下而上和自上而下两个方面。自下而上因素方面的研究主要考察了目标空间类因素(如距离、方向)和目标特征类因素(尺寸、形状)对
学位
随着虚拟现实技术走向商用领域,用户对触觉反馈有了更高的需求。当下的触觉反馈设备存在拟真度低、造价高昂及研发技术复杂等诸多局限性,虚拟现实环境中仍然缺乏良好的触觉反馈。基于多感官错觉理论的伪触觉反馈技术具备易于模拟多模态触觉感知、造价低廉等优势,为触觉反馈技术的发展开启了新方向。传统伪触觉反馈技术重视对视觉线索的利用,却忽视了同触觉存在紧密联系的听觉线索,因此,基于视听线索的多通道伪触觉反馈技术还有
学位
分配公正是资源分配的指导原则,也是关于公平的理论和实证研究的中心焦点,不偏袒任何一方的资源分配即为公平,随着年龄增长,儿童从基于简单的平等分配逐渐转变为复杂的按劳分配和按需分配的公平标准。当个体作为第一方得到的资源少于同伴或多于同伴时实施纠正行为的不公平厌恶,以及个体作为第三方目睹他人之间的自私和慷慨分配进行阻止行为的第三方干预均属于公平维护行为。以往研究发现合作促使儿童公平维护行为早期出现的证据
学位
在党的十九大报告中有明确指出,要努力探索新时期下乡村治理新思路,探索乡村治理新体系,加强基层治理的建设。如何建立健全新型乡村治理体系是现如今基层工作的重点,其中解决乡村治理中“人”的短板,是健全自治、法治、德治相结合的乡村治理体系的根本所在。随着乡村治理体系的不断完善,“神农英才计划”“雏鹰计划”等相关政策的提出,许多在外经商多年的精英能人返乡担任村干部,希望能为家乡建设贡献一份力量。精英能人已经
学位
粮食对保持经济向前发展、政治稳定和实施可持续发展战略具有重要意义。当前,新冠肺炎疫情仍在全球肆虐,旱灾、暴雨等各种极端气候或自然灾害仍在世界各地频频出现,世界粮食面临减产的风险上升,全球粮价维持在高位运转。面对全球粮食市场的诸多复杂局面,身为全球粮食的生产供应强国、消费需求强国和进口商品贸易大国,我国的粮食安全不仅关系着国内经济与社会的发展平衡,也将直接影响到全球粮食的供求平衡与国际价格水平。因此
学位
随着现代化和市场化对乡村产生影响,村庄逐渐“原子化”和“陌生化”使得乡村熟人关系的作用式微,乡村治理面临新的挑战。2018年的中央一号文件明确提出乡村治理要坚持农民的主体地位,强化基层治理主体是推进乡村振兴战略的基础性工作。对于善治的实现,乡村公共空间的作用不可小觑。当前,国内学界关于乡村公共空间理论的研究主要围绕茶馆、宗祠、村庙等传统乡村公共空间展开,对于乡村便利店这一公共活动空间的研究较少,但
学位