论文部分内容阅读
人工神经网络(Artificial Neural Network,ANN)是互连的大规模并行处理器,它能通过高度互连的的神经元来解决复杂优化问题。ANN模型由于其良好的学习和泛化能力,已被广泛应用于电磁、测量等领域。粒子群优化(Particle Swarm Optimization,PSO)算法作为一种容易实现、收敛速度快的全局优化算法,可以代替常用的误差反向传播(Back Propagation,BP)算法应用到ANN的训练中来。但是面对复杂度较高的问题时,训练时间长是粒子群神经网络(PSO-ANN)的一大问题,并行化加速是解决该问题的有效思路之一。除了ANN固有的存储结构和样本训练的并行性,PSO-ANN还存在PSO算法天然具备的群体中个体行为的并行性。相比用计算机集群、多核CPU或FPGA等专业并行设备加速PSO算法,利用图形处理单元(Graphic Processing Unit,GPU)并行加速PSO算法具备硬件成本低的最显著优势。特别是2007年NVIDIA公司推出统一计算设备架构(Compute Unified Device Architecture,CUDA)后,CUDA C因其强大的可编程性已成为当前最为流行的GPU编程语言。本文在GPU端并行PSO算法和GPU端样本并行BP-ANN算法的研究基础上,设计并实现了基于CUDA架构的并行PSO-ANN求解方案和并行PSO-BP-ANN求解方案,并对微带天线(Microstrip Antennas,MSA)谐振频率、波达方向(Direction of Arrival,DOA)估计等问题进行快速建模,在较短时间内使建模误差优于已有文献结果。论文主要工作可归纳如下:(1)针对GPU端并行PSO算法的传统加速比指标的不合理之处,提出用“有效加速比”作为算法的性能指标,并对基准测试函数进行了测试和分析。(2)在GPU端并行PSO算法的研究基础上,设计并实现了一种基于CUDA架构的并行PSO-ANN求解方案,对测试函数逼近问题进行了测试和分析。(3)用设计的GPU端并行PSO-ANN算法分别对矩形和圆形MSA谐振频率问题进行建模,并对建模速度和建模误差进行了分析。(4)在GPU端样本并行BP-ANN算法的研究基础上,结合所设计的GPU端并行PSO-ANN算法,设计并实现了基于CUDA架构的并行PSO-BP-ANN求解方案,对DOA估计问题进行建模,并对建模速度和建模误差进行了分析。