基于MPI的FDFD并行算法及其应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kisscase
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频域有限差分法(FDFD)在计算具有谐振结构电磁问题上比时域有限差分(FDTD)方法有明显的优势。然而FDFD方法需要求解大型复数稀疏矩阵方程的逆来获得方程的解。就笔者所知,目前文献中没有大型复数稀疏矩阵方程并行求解的高效方案。为解决FDFD串行算法计算规模的限制以及提高计算效率,本文研究了基于MPI的FDFD并行算法,使计算规模和计算效率得到明显提升。本文的主要研究内容如下:(1)本文研究了基于MPI的三种FDFD并行算法。其中并行方案一采用传统“十”字分割方法分割复数稀疏矩阵,并将每一块子矩阵分配到各进程中,该方法内存消耗与串行方法相当,但加速比仅有2倍左右;并行方案二采用按行分配的原则将矩阵分配到各进程中,同时需要在每个进程中完整存储中间矩阵。该算法在计算效率上有了十数倍的提升,但内存占用随进程数增加线性增长;并行方案三引入MPI-3内存共享机制,解决了方案二内存占用高的问题。(2)给出了基于磁场迭代的FDFD并行算法。在仅需求解计算域内磁场值而非电场值的特殊电磁问题上,采用磁场迭代的方案可以减少内存消耗和提高计算效率。本文推导了基于磁场迭代的FDFD算法的计算公式,并实现了该算法基于MPI的并行计算。文中算例相比于传统电场方案计算效率约提升35%,内存消耗降低7%左右。(3)结合傅里叶变换研究了HEMP晚期波作用下大场景的传输特性。针对HEMP晚期波时域波形持续时间超长,脉冲频谱很窄的特点,本文采用FDFD并行算法结合FFT计算了HEMP晚期波作用下大场景的传输特性,为超长脉冲电波传播特性的分析提供了思路。
其他文献
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。聚类算法是一种高效的无监督学习方法,被广泛应用于许多领域,包括机器学习,数据挖掘、模式识别、图像分析和生物信息学等。但是已有的聚类算法仍存在一些难点问题,例如复杂数据集中存在的簇间密度不均匀、聚类形态多样、聚类中心的识别等。针对这些问题,本文设计研究了相应的聚类算法以改进现存的问题,提高聚类算法的性能。具体研究内容如下:(1)针对
自Heusler合金问世以来的一百多年时间里,由于大量具有各种物理特性的新型Heusler合金材料不断被发现、制备并广泛应用,使得对于新型Heusler功能材料的设计与合成至今依旧是材料科学领域的热点研究方向之一。我们使用基于密度泛函理论的第一性原理计算的方法对原子替换所得的Ag基Heusler合金材料进行了高通量计算,得到了多种稳定的新型Heusler合金结构。文中系统的讨论了这几种新结构的稳定
硅元素及其化合物在现代工业中起着不可或缺的作用,现已经被广泛应用到了各个相关领域中。本文采用原子掺杂的方法,寻找新型的硅同素异形体和硅化物结构,并结合第一性原理计算方法研究了新结构在常压下的力学性质、弹性各向异性、电子结构等性质,同时还分析了能带变化的影响因素,为有效合成该材料提供理论基础,也为其他新材料的理论研究提供支撑。本文研究的主要内容如下:1.对G21、G58、G90、G117、G158、
随着科技的快速发展,功能材料已经广泛应用于现代工业的各个领域之中,新型功能材料的结构设计与合成是目前材料科学的研究热点之一。本文采用基于CALYPSO的晶体结构设计技术,首先结合只限定原子数的直接搜索方法,发现了一个具有直接带隙的新型大胞超硬碳晶体结构Fmmm-C80。然后采用功能材料反向搜索方法,在使用CALYPSO搜索晶体结构的过程中,设定带隙为每一代结构中的二次筛选目标参数,最终发现了一个新
传统的密码系统假设攻击者只能访问密码算法的输入和输出,即密码算法处在一种黑盒模型下。但随着计算机与互联网技术的高速发展,攻击者的能力得到了显著提高,传统的黑盒模型已经无法满足密码算法安全性分析的需要。2002年,Chow等人根据数字版权管理(Digital Rights Management,简称DRM)应用场景,提出白盒攻击环境(White-Box Attack Context,简称WBAC)的
低序级断层延伸短,断距小,识别解释有一定的困难,但低序级断层是局部微幅度构造和油气富集的主控因素,能否识别低序级断层和微幅度构造直接影响致密储层水平井部署,轨迹控制和砂岩钻遇率。本文首先基于多窗口倾角扫描的曲率属性,凸显低序级断层的特征;然后采用属性定量优化方法,即结合地震剖面,平剖结合统计不同断距断层的曲率值,以此设定门槛值,消除非断裂地质效应,突出目标低序级断层和微幅度构造的平面剖面特征,提高
深度神经网络的分布式训练包含模型并行,数据并行等不同策略。传统模型并行流水化策略将深度神经网络按层分配到不同计算设备上,通过重叠计算时间与通信时间减小分布式通信的开销,但是该策略将神经网络模型中的分支和捷径与其他神经网络结构看作一个整体,在切分模型时难以保证结果的均匀分布,导致训练迭代时间增加。数据并行通常使用同步法进行计算设备间模型参数的更新,在每个迭代周期的末尾,参数服务器会与各计算设备进行通
图像信息是人们获取信息的重要组成部分,高质量的图像会让人们获得更加准确的信息,而由于图像在获取的过程中受到设备和环境的限制,客观上导致了部分图像信噪比低下。随着人们对图像质量的需求越来越高,真实图像去噪问题在生产和生活中有着重要的作用。针对真实图像去噪,国内外学者提出大量算法,但是这些去噪算法基本上都是基于高斯白噪声的假设,在仿真的高斯图像上能取得理想的去噪效果,但是在实际的相机系统中,由于实际噪
荧光寿命与荧光团所处的微环境密切相关,且不受激发光强度、荧光团浓度和光漂白等因素影响,能够提供与荧光光谱技术、荧光显微技术互补的生物体功能信息。荧光寿命测量系统一般是基于激光扫描共聚焦显微系统(LSCM)搭建的。LSCM的分辨率能够达到亚微米量级,是研究生物组织样品的重要工具,在生命科学、生物医学、工业检测等领域获得了广泛的应用。LSCM中的共焦小孔使得焦平面以外的荧光被屏蔽,只有焦点处的荧光才能
通信信号的自动调制识别(Automatic Modulation Classification,AMC)被广泛应用于战场通信侦察对抗及无线电频谱监测等军事和民用领域。最近深度学习在AMC中显示出较好的应用效果,克服了传统AMC方法中依赖专家经验的“特征工程”的缺陷。然而,现有深度学习AMC的方法大都依赖海量标记数据,且要求决策场景与训练场景有较强的一致性,在现实复杂电磁环境下应用局限。针对该问题,