卷积神经网络的FPGA实现研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liyongdede
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Network, CNN)以其特有的网络结构在语音识别和图像处理等方面有着独特的优越性,得到越来越广泛的关注和应用,其计算规模越来越大,模型层数越来越多。随着微电子制造工艺和集成电路设计的进步,现场可编程门阵列(Field Programmable Gate Array,FPGA)得到了快速发展,因为其资源丰富、设计灵活、功耗低的特点,已经被广泛使用。在FPGA的众多应用中,具有计算密集、存储密集特点的卷积神经网络的研究与实现在视频图像处理等领域具有重要的理论意义和应用价值。  论文首先对卷积神经网络前向传输模型进行研究,深入分析了模型中几种主要运算的计算方法,包括二维卷积运算、三维卷积运算、非线性函数运算、池化操作和分类器。然后为了分析在FPGA芯片上实现卷积神经网络的并行性,论文研究了二维和三维卷积运算的数据相关性,并提出了一种新的三维卷积运算模型,利用在FPGA中实现的中间数据延迟线IDDL(Intermediate Data Delay Line)避免输入数据的重复载入,极大提高了计算模型的计算性能,同时,在三维卷积运算模型中定制了一些硬件结构来降低功耗。论文选择 Xilinx公司 Zynq系列芯片,采用高层次综合工具 HLS(High Level Synthesis)实现卷积神经网络。Zynq中PS(Processing System)部分负责数据传输,PL(Programmable Logic)部分负责模型中的主要运算,实现了论文提出的三维卷积运算模型和一个结构简单的二维卷积神经网络运算模型。二维卷积神经网络运算模型中包含二维卷积运算、非线性函数运算、池化操作和分类器。  论文对实现的三维卷积运算模型和二维卷积神经网络运算模型的资源占用率和功耗情况进行了详细的分析,计算性能与 CPU和 GPU进行了对比。当系统时钟为100M时,三维卷积运算模型处理30张大小为256×256的灰度特征图与11×11×4的卷积核卷积,只需要5.9ms,并达到268.07 GOPS(Giga Operations Per Second)的速度。设计实现的二维卷积神经网络模型对一幅输入图像的处理时间为7.80E-6s。论文提出的三维卷积运算模块的计算性能与CPU相比,平均快14倍,略快于GPU。本文基于FPGA实现的二维卷积神经网络模型的速度是GPU的0.66倍,是CPU的3.69倍。对于每瓦特的速度,FPGA的性能远远优于CPU和GPU。
其他文献
本论文是在中-俄(NSFC-RFBR)国际(地区)合作与交流项目:“基于空气、冰与水的物理特性测量冰厚度与力学强度的理论与试验研究(课题编号:60811120556)”、高等学校博士学科点博
目的 对比锁定钢板切开复位内固定术与解剖钢板切开复位内固定术治疗pilon骨折患者的临床疗效.方法 选取2017年8月~2018年9月我院pilon骨折患者82例,依据手术方案不同分组.B组
本文以用于测试三型火箭炮中方向机齿轮箱性能的试验台为研究对象,对传动试验台进行设计与搭建,使其具备测试跑合、效率、振动噪声和温升等功能。此外,研究分析试验台的动态
磁流变阻尼器(MRD)具有阻尼可控、耗能少,响应迅速等优点,已成为汽车、土木、航空等领域半主动控制研究热点。基于磁流变可控阻尼的随动控制系统利用磁流变阻尼器良好的可控性,与传感器和控制器相结合后,再现目标阻尼力,达到随动控制目的。本文设计了面向随动控制的单出杆磁流变阻尼器,探讨了单出杆磁流变阻尼器体积补偿结构设计。开展了磁流变阻尼器示功特性测试。在试验数据基础上分别建立了阻尼器神经网络模型与逆向模
当今时代,科技的发展日新月异,新技术层出不穷。频率源作为现代授时、守时中的重要组成部分,在诸多领域得到了广泛的应用。随着卫星导航、雷达探测、新一代信息网络、导弹制导等
学位
大型船舶在航行过程中,长期受到各种载荷的作用和恶劣环境的侵蚀,船体会产生各种变形和损伤破坏,可能造成重大人身事故和财产损失等。因此我们有必要对船舶进行实时健康监测
本文使用非傅里叶热传导定律研究了碳纤维增强树脂基复合材料身管在火药燃气温度作用下的热传导问题,讨论了内衬层材料对温度场的影响;使用广义热弹性理论计算了身管中的瞬态
风的流速、流量和流向测量与控制与人们的日常生活息息相关。目前风速主要的测量仪器有机械式风速传感器、皮托管风速仪、超声波测速仪、多普勒测速仪、粒子成像测速度场仪、
目的 研究不同血运重建方式对老年冠心病合并左心室功能不全患者手术效果的影响.方法 选取我院老年冠心病合并左心室功能不全患者98例,根据血运重建方式不同分为A组和B组,各4