论文部分内容阅读
大规模并行计算机的快速发展和应用,使得复杂物理系统的高分辨率数值模拟已成为可能.在这些数值模拟中,系统隐式离散后,通常需要求解稀疏线性代数方程组,所耗费的时间有的甚至达到模拟时间的80%.为了有效缩短数值模拟时间,要求相应的应用程序必须具有高度的可扩展能力.因此,在大规模并行机上发展具有高可扩展能力的线性解法器,是实现高性能数值模拟的重要组成部分,具有重要的理论意义和应用价值. 本文的工作主要有以下五个方面: 第一,通过减少(串行)GPBiCR方法中全局同步化点的个数,提出了并行GPBiCR方法(记作PGPBiCR).所得的PGPBiCR方法与原GPBiCR方法具有相同的收敛性和数值稳定性,我们对两种方法在分布式存储并行机上实现时的并行性能,进行了分析,得到新方法的同步开销减少为原米的三分之一.对比GPBiCR方法,从理论上证明了PGPBiCR方法的可扩展性得到了提高,通讯性能提高比率趋向于66.7%.数值试验得出了与理论分析相吻合的结果. 第二,通过消除(串行)BiCGSTAB2方法中内积计算的数据相关性,提出了并行BiCGSTAB2方法(记作PBiCGSTAB2).所得PBiCGSTAB2方法与原BiCGSTAB2方法具有相同的数值稳定性和收敛性.为了保证性能分析的可靠性与公平性,把连续的偶数步与奇数步两次迭代整体看成一个大迭代步.对比BiCGSTAB2方法,从理论上证明了PBiCGSTAB2方法的可扩展性得到了提高,通讯性能提高比率趋向于66.7%.对两种方法在分布式并行机上进行了性能测试,所得数值试验结果与理论分析结果相吻合.同时,也通过数值例子验证了两种方法具有相同的收敛性和数值稳定性. 第三,基于日前占主流的多核体系结构的并行计算机,以及利用矩阵的低秩性所产生的快速健壮的结构化多波前分解(robust structured multifrontal factoriza-tion,记作RSMF)方法,提出了多核并行RSMF(记作MRSMF)方法.MRSMF方法主要对RSMF方法的嵌套分割排序、符号分解以及数值分解三部分进行了多核并行实现.其中符号分解和数值分解是基于二叉消元树的分支结构来实现多核并行的.数值试验表明MRSMF方法是有效的. 第四,基于二维三温辐射扩散方程及其离散系统,利用离散所得的三温矩阵所具有的块对角结构,对RSMF方法中的重排序和符号分解部分进行了分块操作,在数值分解部分利用了块矩阵操作技术.使得重排序和符号分解部分的时间效率得到了明显改善,同时基于良好的排序和块矩阵操作技术,数值分解部分的时间效率也得到了提升.我们把这种分块形式的方法称作分块RSMF(记作BRSMF)方法.数值试验部分通过五点离散模板所得的三温矩阵验证了BRSMF方法的稳定性与高效性,而且随着问题规模的增大,改进效果越来越显著. 第五,基于前面所提出的MRSMF方法和BRSMF方法,进一步给出了适用于三温线性方程组的多核并行分块RSMF方法(记作MBRSMF).该方法把MRSMF方法多核并行的特点与BRSMF方法分块操作的特点充分结合了起来,使得所产生的MBRSMF方法同时具有了多核并行和分块操作的特性.数值试验部分基于二维三温辐射扩散方程的五点离散模板,验证了MBRSMF方法比MRSMF和BRSMF方法更有效. 最后我们利用具有实际意义的三温模型所产生的线性方程组,对本文所给的PGPBiCR方法,MRSMF方法,BRSMF方法以及MBRSMF方法进行了性能测试.测试结果进一步验证了所提方法的有效性.