高精度CFD软件OpenCFD众核移植及优化

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lzwxy105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算流体力学(CFD)在航空航天等领域发挥着重要作用,该领域对先进CFD软件有着强烈的需求。随着计算技术的发展,众核构架计算机在大型计算机成为了主流。将CFD程序移植到众核构架并进行优化,充分发挥众核计算机的高效能以缩短计算周期,是十分必要的。论文在课题组自行研发的高精度CFD软件OpenCFD基础上进行移植、优化及改进。先后将高精度差分模块OpenCFD-SC及化学反应流动高精度计算模块OpenCFD-Comb移植到MIC及国产众核处理器系统,并进行了优化及改进。测试显示,程序具有很高的并行效率,可充分发挥众核计算机的性能,提升了软件的计算能力。论文的主要工作如下:  首先,结合Intel最新推出的协处理器MIC对高精度流场直接数值模拟程序OpenCFD-SC进行了移植和优化,根据MIC的架构特点和程序求解流程,提出交换区数据重构和增大计算量来减少数据传输量这两个优化算法,大大降低了程序的通信量,提高了程序的加速性能。  随后,将化学反应高精度计算程序OpenCFD-Comb进行了并行优化并向MIC系统上进行移植和优化。利用该程序,将氢气射流燃烧算例移植到MIC上进行计算,根据射流燃烧的特点,且在计算过程中自封闭,将源项计算移植到MIC上进行。对计算结果进行了定量分析,验证了计算结果的正确性。在加速性能测试中,核心函数区域达到了4.4倍加速比,源项计算时间所占比例大幅降低。  最后,在国产众核计算平台上采用OpenACC对程序进行了并行化处理,采用基于消息传递编程模型的MPI进程级并行和基于共享变量编程模型的众核线程级并行的两级并行模式对计算流程中的热点函数进行加速执行。在单节点加速性能测试中整体程序达到了4.78倍加速比。对程序进行了大规模强扩展性测试,以16个CG共1024核为基准,最大采用1024个CG共65536个核对算例进行测试,取得了接近50%的计算效率。
其他文献
伴随着信息技术的飞速发展,承载于网络平台的信息以指数级态势增长,信息量的暴增虽然极大的丰富了人们的生活,但是过量信息的同时呈现反而使得人们越来越难以获取到感兴趣的
随着OpenFlow协议的发展,OpenFlow交换机的转发面从简单的基于十元组的流表结构变成OpenFlow1.3规范中的多达40个匹配域的多级流表流水线结构。复杂而又灵活的流表流水线结构
矢量场是科学研究和数值仿真中的重要对象,它常常涉及到一些非常复杂的动力性质,依赖于可视化方法来表现为易于观察的视觉表达形式。这些可视化方式大部分都依赖于大量的数值运
为优化现有系统在大数据环境下面临的处理不及时和可视化效果不佳的问题,本文实现了海量实时多源异构数据流提取、汇聚与存储机制,在此基础上,针对大数据实时计算应用和基于实时
直接体绘制是分析体数据的有效手段,被广泛运用于医学成像、科学数据可视化和游戏等领域。一方面,为了应对大规模体数据带来的挑战,本文对异构环境下的并行图像合成算法进行了研
本论文对基于空间运动图像的增强和超分辨率重建研究,主要针对空间飞行器定位、对接等情景中的图像处理问题进行研究。针对空间运动图像的特点和应用中出现的问题如边缘模糊
随着计算机技术的快速发展和数码产品的日益普及,个人数字多媒体文件的数量与日俱增。如何利用现有多媒体技术挖掘这些文件中蕴含的丰富信息,为用户提供形式更加新颖、功能更
随着暗物质的发现,暗能量的提出,特别是宇宙加速膨胀的发现,宇宙学正处于快速蓬勃发展的阶段,逐渐发展成一门精确的宇宙学[1]。由于宇宙高度非线性,长时间演化等特征,宇宙模拟计算
随着异构网络的不断融合,以及多种无线接入技术长期并存的趋势,多连接技术能够支持多接口终端保持多个网络连接同时通信,将广泛应用于未来异构网络中,各国际标准组织都展开了
中国古代建筑具有悠久的历史传承和辉煌的艺术成就,是中国文化中的一块瑰宝,对中国古代建筑进行建模研究是当前虚拟现实和计算机视觉领域的一项重要热点。古代建筑建模研究的成