论文部分内容阅读
电磁场与电磁波在生产生活中发挥着越来越重要的作用。数值计算具有精确高效、灵活方便等显著优势,因此成为电磁特性分析与设计的现代化手段,也日益发挥着越来越重要的作用。时域有限差分(FDTD)法作为电磁场三大经典数值方法之一,具有自己独特的优势。对于电大尺寸及具有复杂(细小)结构的电磁目标仿真,巨大的内存资源和计算时间消耗成为了该算法的限制因素。随着当今计算机软硬件的飞速发展,大型计算机集群为大规模复杂电磁问题的解决提供了可能。利用计算能力更强的平台来求解大规模电磁场问题成为计算电磁学领域中的热点和挑战之一。作为大型计算机集群中新兴的纯国产计算机而言,由于其编译器等环境都是针对国产CPU的架构自主开发的,与通用计算机平台的环境存在着较大的差异,且在纯国产超级计算平台中对电磁应用领域进行相关的研究工作具有更高的安全性,因此在国产计算机中对自主开发的并行FDTD算法程序进行移植和测试显得尤为重要。作为提升求解效率的重要手段,采用新型的硬件资源国产众核处理器,可进一步加速求解速度,缩短数值计算的时间。基于上述原因,本文基于国内超级计算机硬件平台,对并行FDTD算法的性能优化及其大规模应用进行了深入研究。本文的主要工作可以概括为:(1).基于FDTD方法的运算特性,采用笛卡尔(Cartesian)拓扑结构来描述整个计算空间子区域间的逻辑关系,实现了基于MPI的并行FDTD方法,并建立影响并行FDTD并行效率性能的数学模型。通过理论分析,提出可获得较高并行性能的虚拟拓扑选取理论准则。同时给出一种采用并行策略实现基三角面片模型来提取FDTD立方体模型的方法,使得核心程序与模型无关,相比于串行建模法,极大的提高了建模速度。当问题规模较大时,效率可提升60%以上:(2).基于上述理论准则,在国家超级计算天津中心和国家超级计算深圳中心两个通用平台上对并行FDTD虚拟拓扑优化进行了大量测试验证工作。通过对天津中心测试结果的分析,得出跨节点通信少的虚拟拓扑可获得较好的并行性能。而通过对深圳中心测试结果的分析,得出在整个通信任务中,占主要通信任务的通信量小时,算法可获得较好的并行性能。综合两个通用平台上的结果以及数学模型得出的理论准则,给出通用平台上并行FDTD最优化虚拟拓扑的一般性准则,即:a、基本准则是选择拓扑使得总通信量最小:b、通信总量相当的情况下,跨节点通信少的拓扑结构性能一般较好;c、跨节点通信量相当时,选择通信负载较为均衡的拓扑。基于该准则,计算时可获得较高的并行性能;(3).考虑到纯国产CPU的计算机与通用计算机平台的区别,研究了纯国产平台上并行FDTD方法获得高效率的虚拟拓扑准则。受限于国产CPU的内存,整个测试采用分段测试的方式进行。通过对测试结果的分析,得出了与通用平台上基本一致的最优化虚拟拓扑选取准则;(4).基于国产众核平台的特点,对并行FDTD方法进行了算法上的移植。并针对国产众核平台上独有的编程方式,对并行FDTD方法的并行策略进行了优化。通过对多个算例模型的测试,得出了在国产众核平台上算法的加速性能;(5).在不同的测试平台上,对FDTD的并行性能进行了测试。在纯国产CPU计算机平台上突破了10万核,以128 CPU核为基准,算法在10240 CPU核时的并行效率仍可达67%以上。在通用平台上突破了30万核,以6万CPU核为基准,算法在30万CPU核时的并行效率可达80%以上。在国产众核平台上突破了400万核,最大计算Yee网格量约为1万亿;值得指出,根据2015年5月的查新报告显示,这是目前国际上最大并行规模的国产电磁仿真应用。(6).在不同的超级计算机平台上就几种典型的电磁应用进行了仿真分析,包括天线的辐射特性分析、载机平台的散射特性分析、机载天线的受扰方向图分析以及雷电袭击飞机时,飞机周围的近场分析等;(7).基于GiD软件进行了二次开发,形成了一套自主可控的并行FDTD软件。通过该软件可实现从建模、参数设置、媒质赋值、MESH剖分、计算和后处理显示等一体化过程。