论文部分内容阅读
有限元法在模拟裂纹扩展,特大变形等过程时,会遇到网格畸变等问题,需要不断的进行网格重剖分过程,非常耗时。无网格法采用基于点的近似,不依赖于网格质量,避免了网格重剖分过程。但是无网格法发展还不成熟,计算效率和精度等问题亟待解决。本文从插值形函数的角度出发,研究了影响无网格法计算效率和计算精度的各个因素。应用多核CPU和GPU的高速并行计算技术,加速无网格法插值过程。分析了多种插值算法的各部分耗时情况,确定加速方案,给出并行算法计算流程,通过数据测试验证加速算法的可行性。对并行加速算法的加速效果进行分析,探讨相关影响因素。最终开发出了适应于无网格法的并行插值算法,并提出提高无网格法计算效率的改进方案。本文主要研究工作如下:(1)在CPU上,考虑可并行性和数据依赖性开发了RBF、MLS和Shepard插值算法的串行实现,并通过利用OpenMP接口来研发插值算法在多核CPU上的并行实现。分析在多核CPU上的并行实现,把相应并行部分代码转化为CUDA核函数,研发出插值算法在GPU上的并行实现。在GPU上的并行实现的基础上,利用Open-MP接口研发出插值算法在多块GPU上的并行实现。(2)本文在配备有两个Quadro M5000 GPU的工作站上测试了五组数据,进行评估所提出的并行插值算法的性能。对于20,30,40,50和60五个不同k值,给出了每组数据测试的运行时间和相应的加速比以及插值精度结果。(3)研究了基函数和权函数的选取、形状参数、节点影响域大小和节点分布特征对径向基等多种插值算法计算精度的影响。详细比较、分析了选取不同参数时导致的计算误差,为提高插值算法的计算精度,提供了一些参考建议与改进方案,取得了较好的效果。(4)分析无网格法中插值部分的计算流程,提出了插值部分的并行优化方案。将所有积分域内的积分点计算应变矩阵过程从组装总体刚度流程中抽离出来,使用本文的并行插值思想进行优化并行。分析讨论是否固定支持域内场节点的数目对计算效率和精度的影响。将本文的并行插值思想应用到了悬臂梁的无网格法计算上,对比优化前后的计算效率和计算精度。