多核直接和并行迭代法及其在辐射流体力学中的应用

来源 :中国工程物理研究院 | 被引量 : 0次 | 上传用户:hccstarttttt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模并行计算机的快速发展和应用,使得复杂物理系统的高分辨率数值模拟已成为可能.在这些数值模拟中,系统隐式离散后,通常需要求解稀疏线性代数方程组,所耗费的时间有的甚至达到模拟时间的80%.为了有效缩短数值模拟时间,要求相应的应用程序必须具有高度的可扩展能力.因此,在大规模并行机上发展具有高可扩展能力的线性解法器,是实现高性能数值模拟的重要组成部分,具有重要的理论意义和应用价值.  本文的工作主要有以下五个方面:  第一,通过减少(串行)GPBiCR方法中全局同步化点的个数,提出了并行GPBiCR方法(记作PGPBiCR).所得的PGPBiCR方法与原GPBiCR方法具有相同的收敛性和数值稳定性,我们对两种方法在分布式存储并行机上实现时的并行性能,进行了分析,得到新方法的同步开销减少为原米的三分之一.对比GPBiCR方法,从理论上证明了PGPBiCR方法的可扩展性得到了提高,通讯性能提高比率趋向于66.7%.数值试验得出了与理论分析相吻合的结果.  第二,通过消除(串行)BiCGSTAB2方法中内积计算的数据相关性,提出了并行BiCGSTAB2方法(记作PBiCGSTAB2).所得PBiCGSTAB2方法与原BiCGSTAB2方法具有相同的数值稳定性和收敛性.为了保证性能分析的可靠性与公平性,把连续的偶数步与奇数步两次迭代整体看成一个大迭代步.对比BiCGSTAB2方法,从理论上证明了PBiCGSTAB2方法的可扩展性得到了提高,通讯性能提高比率趋向于66.7%.对两种方法在分布式并行机上进行了性能测试,所得数值试验结果与理论分析结果相吻合.同时,也通过数值例子验证了两种方法具有相同的收敛性和数值稳定性.  第三,基于日前占主流的多核体系结构的并行计算机,以及利用矩阵的低秩性所产生的快速健壮的结构化多波前分解(robust structured multifrontal factoriza-tion,记作RSMF)方法,提出了多核并行RSMF(记作MRSMF)方法.MRSMF方法主要对RSMF方法的嵌套分割排序、符号分解以及数值分解三部分进行了多核并行实现.其中符号分解和数值分解是基于二叉消元树的分支结构来实现多核并行的.数值试验表明MRSMF方法是有效的.  第四,基于二维三温辐射扩散方程及其离散系统,利用离散所得的三温矩阵所具有的块对角结构,对RSMF方法中的重排序和符号分解部分进行了分块操作,在数值分解部分利用了块矩阵操作技术.使得重排序和符号分解部分的时间效率得到了明显改善,同时基于良好的排序和块矩阵操作技术,数值分解部分的时间效率也得到了提升.我们把这种分块形式的方法称作分块RSMF(记作BRSMF)方法.数值试验部分通过五点离散模板所得的三温矩阵验证了BRSMF方法的稳定性与高效性,而且随着问题规模的增大,改进效果越来越显著.  第五,基于前面所提出的MRSMF方法和BRSMF方法,进一步给出了适用于三温线性方程组的多核并行分块RSMF方法(记作MBRSMF).该方法把MRSMF方法多核并行的特点与BRSMF方法分块操作的特点充分结合了起来,使得所产生的MBRSMF方法同时具有了多核并行和分块操作的特性.数值试验部分基于二维三温辐射扩散方程的五点离散模板,验证了MBRSMF方法比MRSMF和BRSMF方法更有效.  最后我们利用具有实际意义的三温模型所产生的线性方程组,对本文所给的PGPBiCR方法,MRSMF方法,BRSMF方法以及MBRSMF方法进行了性能测试.测试结果进一步验证了所提方法的有效性.
其他文献
(a,β)-度量是一类非常重要的Finsler度量,这里a为流形上的一个Riemann度量,b为流形上的一个1-形式。本文主要研究了(a,β)-度量的共形几何问题。  首先,我们通过共形相关
该文通过研究汉字编码的特性并根据此特性构造了一个数学模型,利用这个模型为每一个汉字建立索引,在此基础上通过对微软提供的DirectSound编程接口的进一步改造,建立了一个很
本文引入了进位吸引子的概念.并原创性的研究了进位吸引子与拓扑熵之间的关系.对于具有进位吸引子的区间映射,通过对其吸引子的简单分类,就可以确定绝大部分此类系统的拓扑熵情
截断牛顿法是适用于求解大型优化问题的有效方法。由于截断牛顿法是通过非精确求解牛顿方程得到寻查方向,因此牛顿方程求解精度的控制是算法的关键。本文基于函数与其二次模型
我校英语组有一个国家级重点课题———《以学生学习活动为主线的教学设计与教学实践研究》。该课题主要倡导“将课堂还给学生、学生是课堂的主人”的教学理念。但在学生自学
分形图像压缩方法基于块匹配的思想,将编码图像分割为子块,对每个子块,搜索使拼贴误差达最小的父块,建立起映射关系,再根据压缩映射不动点定理解压出原始图像的近似图像.这种
合金凝固中产生的宏观偏析现象一直是金属工业界关心的一个中心问题,现在其他的一些交叉学科如计算数学、计算物理等也开始涉足这一领域.该文阐述的就是从这样一个视角出发对
非线性代数方程组(或者称多项式方程组)的数值求解,特别是其全部解的计算问题,有重要的理论价值,又有很强的应用背景,是理论物理等基础科学领域,以及电力系统、机械工程、化学工程
优化作业布置是提高学生学习质量的重要一环,下面是我就三种课型如何布置作业的心得体会。一、听说课外研版新标准教材中每个模块的第一单元都是听说课,重在培养学生的听说能
在经营决策中,经常会利用抽样或试验等手段来获得最新信息,然后再作决策,从而改善决策结果.但因抽样要推迟作决策的时间,又要花费人力,物力,财力等,对把经济效益放在首位的决策