论文部分内容阅读
数值仿真在汽车车身结构优化设计过程中发挥着重要的作用,但随着结构复杂度的不断增加,计算量大、计算效率低等问题日益严峻,严重制约了数值仿真及优化设计在实际工程中的应用。为提升数值仿真的计算效率,研究人员一方面从数值计算方法的理论研究着手,开发了诸多快速计算方法,如利用已知结构的解及求解信息去估计修改后结构解的重分析方法,从计算方法上提升计算效率;另一方面,利用并行计算机的硬件优势,通过并行技术对数值仿真进行加速,从而获得更高的计算效率。目前主流的并行算法多建立在以CPU为核心的并行平台上,价格昂贵、维护成本高,难以得到普及使用。此外,由于这类架构多采用粗粒度并行模式,计算节点间的通信与协作机制较为复杂,导致程序开发难度较大。同CPU并行架构相比,图形处理器GPU(Graphics Process Unit)的主要优势在于其拥有强大的浮点运算能力和高存储带宽,且价格低廉。同时,统一计算架构CUDA(Compute Unified Device Architecture)为GPU并行程序开发提供了简单高效的软件开发工具。针对复杂产品设计中大规模计算的客观需求,采用重分析方法虽能提高计算效率,但仍难以满足实际工程问题的计算需求,在同时考虑计算方法和并行技术的前提下,本文建立了以GPU并行重分析为主线的结构优化设计系统。对结构进行单次修改时,提出了具有高精度和高效率特点的GPU并行重分析计算方法;结构概念设计阶段,提出了基于GPU并行重分析的拓扑优化计算方法;结构详细设计阶段,提出了基于GPU并行重分析的多数据分组全局优化算法;为克服单GPU计算能力的限制,建立了基于多GPU平台的并行重分析系统。本文的主要工作和成果如下:(1)针对重分析方法的计算效率瓶颈,提出了GPU并行重分析计算方法,开发了基于GPU平台的并行重分析计算程序,实现了较大规模汽车结构重分析的并行计算。采用线程映射单元、线程映射非零元素两种映射策略,提出了重分析方法中刚度矩阵的并行计算及组装方法;采用对称超松弛方法构建稀疏近似逆矩阵,基于CUDA并行计算平台,提出了重分析方法中矩阵求逆的并行计算方法;采用稀疏近似逆作为预处理算子,开发了重分析方法中方程组的并行求解技术。数值算例表明本文提出的GPU并行重分析方法能够大幅度提升计算效率,并能够满足数值仿真计算的精度要求。(2)提出了基于GPU并行重分析的拓扑优化计算方法,开发了基于GPU并行重分析的结构拓扑优化程序,实现了较大规模汽车结构在GPU上的并行拓扑优化。采用线程映射单元的策略,提出了拓扑优化方法中灵敏度的并行计算方法;采用单元-节点、节点-单元双重过滤策略,开发了基于GPU平台的灵敏度并行过滤技术;为确保拓扑优化过程方法中计算精度和计算效率的有效平衡,提出了拓扑优化过程中是否采用重分析的准则:结构修改度,并根据结构修改度值的大小判断当前迭代步是否采用GPU并行重分析。(3)提出了基于多数据分组的全局优化算法MDEGO(Multiple Data Efficient Global Optimization),解决了高效全局优化算法EGO(Efficient Global Optimization)及基于多代理模型高效全局优化算法MSEGO(Multiple Surrogate Efficient Global Optimization)产生寻优点的瓶颈。MDEGO算法充分考虑多数据分组产生多样性,从而在优化过程的单个迭代步内产生多个寻优点,克服了EGO算法单个迭代步内只产生一个寻优点的瓶颈;与MSEGO算法采用多种代理模型产生多样性的策略不同,MDEGO算法采用多数据分组产生多样性的策略更加简单便捷,在相同的仿真次数内,较MSEGO具有更快的收敛速度。为进一步提高MDEGO算法的计算效率及工程实用性,开发了基于GPU并行重分析以及考虑多数据分组的GPU并行全局优化程序,实现了较大规模汽车结构在GPU上的并行全局优化。(4)针对单GPU上难以进行某些大规模汽车结构重分析计算的瓶颈,提出了多GPU并行重分析计算方法。采用具有良好扩展性的多GPU并行策略,实现了重分析算法中的数据分配、矩阵向量乘、向量点乘等操作的多GPU并行计算;采用预处理共轭梯度法,实现了重分析算法中方程组的多GPU并行求解。为进一步提升程序的计算效率,采用非阻塞通信模式,减少了CPU与GPU之间的数据交换时间。并在此基础上,提出了基于多GPU并行重分析的拓扑优化计算方法和全局优化计算方法,开发了多GPU并行重分析及其结构拓扑优化和全局优化程序,能有效求解单GPU不能处理的大规模计算问题。