基于GPU的粒子群神经网络研究与应用

来源 :江苏科技大学 | 被引量 : 2次 | 上传用户:fengying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工神经网络(Artificial Neural Network,ANN)是互连的大规模并行处理器,它能通过高度互连的的神经元来解决复杂优化问题。ANN模型由于其良好的学习和泛化能力,已被广泛应用于电磁、测量等领域。粒子群优化(Particle Swarm Optimization,PSO)算法作为一种容易实现、收敛速度快的全局优化算法,可以代替常用的误差反向传播(Back Propagation,BP)算法应用到ANN的训练中来。但是面对复杂度较高的问题时,训练时间长是粒子群神经网络(PSO-ANN)的一大问题,并行化加速是解决该问题的有效思路之一。除了ANN固有的存储结构和样本训练的并行性,PSO-ANN还存在PSO算法天然具备的群体中个体行为的并行性。相比用计算机集群、多核CPU或FPGA等专业并行设备加速PSO算法,利用图形处理单元(Graphic Processing Unit,GPU)并行加速PSO算法具备硬件成本低的最显著优势。特别是2007年NVIDIA公司推出统一计算设备架构(Compute Unified Device Architecture,CUDA)后,CUDA C因其强大的可编程性已成为当前最为流行的GPU编程语言。本文在GPU端并行PSO算法和GPU端样本并行BP-ANN算法的研究基础上,设计并实现了基于CUDA架构的并行PSO-ANN求解方案和并行PSO-BP-ANN求解方案,并对微带天线(Microstrip Antennas,MSA)谐振频率、波达方向(Direction of Arrival,DOA)估计等问题进行快速建模,在较短时间内使建模误差优于已有文献结果。论文主要工作可归纳如下:(1)针对GPU端并行PSO算法的传统加速比指标的不合理之处,提出用“有效加速比”作为算法的性能指标,并对基准测试函数进行了测试和分析。(2)在GPU端并行PSO算法的研究基础上,设计并实现了一种基于CUDA架构的并行PSO-ANN求解方案,对测试函数逼近问题进行了测试和分析。(3)用设计的GPU端并行PSO-ANN算法分别对矩形和圆形MSA谐振频率问题进行建模,并对建模速度和建模误差进行了分析。(4)在GPU端样本并行BP-ANN算法的研究基础上,结合所设计的GPU端并行PSO-ANN算法,设计并实现了基于CUDA架构的并行PSO-BP-ANN求解方案,对DOA估计问题进行建模,并对建模速度和建模误差进行了分析。
其他文献
传统的视频都是由一个摄像机拍摄,对观看者来说在任意时刻只能看到所拍摄景物的某一个角度的图像,称为单通道视频。随着信息技术的飞速发展,人们已不满足于被动的观看和欣赏电视
随着空间技术的高速发展,空间通信距离越来越遥远,针对火星探测的深空通信网络成为近年来研究热点,本论文是以国家863重点课题:“深空信道模型、中继网络架构和通信传输协议
随着网络技术的发展,多种通信方式应运而生,然而每一种单一的通信方式并不能提供满足用户所有需求,多种通信方式的同时使用又给用户带来极大的不便,影响效率。为解决上述问题
学位
随着互联网技术的日新月异,网络音乐已经成为互联网娱乐的一大支柱产业。目前,网络音乐已突破传统的提供音乐资源为主的服务模式,以音乐为核心的自我创作和社交互动成为新的
现有的人脸识别方法绝大部分是基于二维图像的,虽然在限定环境下,该类方法己经达到了较高的识别率,但由于图像的成像特点以及二维图像本身对三维信息的缺失,识别系统的准确率很大
近年来,计算机和网络技术的迅猛发展使得人们可以方便快捷地获取和传播多媒体作品。但是这也引发了一系列有关多媒体数字作品安全性及版权保护等问题。数字水印技术作为一种
石油钻井工程中,可能会发生各种各样的问题,如果控制不当,则有可能造成严重的钻井事故。为了使钻井操作人员熟练掌握井内发生异常情况后的处理过程,优质安全地快速钻井,就需
近年来3D打印、核磁共振成像、3D扫描、3D渲染、3D重建的等技术有了突飞猛进的发展,3D模型被广泛应用于医学、建筑、工业、电影行业、视频游戏产业、互联网、电子商务等领域,
定位是无线传感器网络中重要的研究方向之一。许多协议或服务都需要知道节点的位置信息。作为一个综合性的研究课题,近年来许多定位算法得以提出。测距无关定位算法虽然有良好
基于网络的信息交换为多媒体数字作品的使用、传播提供了便利的途径,然而由于数字作品极易被非法复制和篡改,使得数字作品的信息安全和版权保护成为迫切需要解决的问题。数字水