基于FPGA的RTL级卷积神经网络计算系统研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:king20051400
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习技术的不断发展,卷积神经网络在图像识别、场景分类、语音识别等多个应用领域展现出了巨大的优势。然而在解决更加抽象和复杂的问题时,卷积神经网络本身也变得更加复杂,网络规模更加庞大,算力要求也更高。如何加快卷积神经网络的计算速度,使其能够较好的部署在移动端从而降低延迟、增加系统性能成为了亟待解决的问题。FPGA作为一种可编程逻辑器件,其功耗低,体积小,性能强,非常适合部署在边缘计算移动终端上,同时其硬件电路实现算法的实现方式和并行计算的特点与卷积神经网络的运作方式十分契合,是实现卷积神经网络移动端部署的理想平台。本文首先介绍了卷积神经网络的基本原理,选取三个典型的卷积神经网络进行分析,然后对卷积神经网络的FPGA计算方式及优化方法进行深入研究,探索了在FPGA硬件平台部署实现卷积神经网络的有效计算方式,具体工作包括:1.提出了一种权重可重配置的卷积核模型,该模型使用具有数据接口的权重寄存器,在每次卷积计算开始前,将存储在外部的权重数据导入卷积核内,计算完成后复位卷积核,达到卷积核复用与最小化卷积神经网络中需要固化的卷积核数量的目的,降低了大型卷积神经网络对于FPGA内部资源量的要求。2.采用了一种新的串行数据流模型,优化了卷积计算中数据流的控制方式,降低了用于读取内存数据的时钟周期占比,增加了计算效率。同时配合数据动态缓存,在一个时钟周期内即可完成一次卷积计算,减少了用于缓存中间数据所需要的内存容量。3.将卷积层与池化层抽象为两级流水,在卷积计算的同时进行池化计算,打破了卷积神经网络计算过程中层级间的串行关系,增加了系统的数据流处理速度,进一步提高了系统的计算性能。4.以Lenet5网络为例,在ZYNQ平台上搭建了用于手写体识别的卷积神经网络计算测试系统,实现了卷积神经网络内部各个模块的编程与仿真,最后使用16位数据对网络进行量化,完成了对MNIST手写体数字数据集的分类测试,取得了较好的成果。分类准确率为97.6%,100 MHZ系统时种下,计算速度为GPU的1.15倍,系统整体功耗为GPU的2.3%。较好的满足了移动端部署卷积神经网络的性能与功耗需求,对卷积神经网络系统的实用化具有积极意义。
其他文献
在过去的几十年里,由于碳纳米管(CNTs)巨大的应用前景和优异的物理性质,人们对它的各种性质进行了广泛而又深入的研究。通过对双壁碳纳米管(DWCNTs)核磁共振的研究发现,相对于单壁碳纳米管(SWCNTs),几乎所有的DWCNTs都有着一致的金属化趋势。在此基础上,通过密度泛函理论(DFT)和分子间Hückel模型(IMH)进一步发现了DWCNTs内外管壁之间的相互作用导致了管间的电子迁移以及轨道
随着视频显示系统需要处理和感知的视频图像信息越来越多,同时需要将多幅图像信息显示在同一显示设备上,视频叠加技术成为解决多幅图像融合的关键。在很多视频叠加应用中,对叠加延时和图像清晰度提出了更高的要求,如战机座舱显示系统等;但由于嵌入式操作系统的延时不稳定,限制了其在实时视频处理平台上的使用,因此需要一种高清晰、低延时的视频叠加技术来满足视频叠加系统在实时视频处理平台的应用。通过对视频处理系统架构及
碳化硅纳米管是由第三代半导体材料组成的纳米管,研究其微观特性和结构稳定性能对于新型纳米半导体器件具有重大意义。近年来对于碳化硅纳米管的理论研究主要集中在电子结构、传输特性、力学性能等方面,对于碳化硅纳米管结构稳定性的模拟研究鲜有报道,充分了解各种构型的碳化硅纳米管结构稳定性,能为日后将碳化硅纳米管应用至半导体领域奠定坚实的理论基础。为此本文研究了碳化硅纳米管在弛豫、升温过程中微观结构和能量的变化,
软磁材料的软磁性质与其内部微观结构密切相关。通过利用分子动力学技术,模拟了液态Fe-Ni-Cr合金在不同参数条件(组分,冷速,压强)下的快速凝固过程。利用平均原子能量,双体分布函数,最大标准团簇,三维可视化等微观组织结构表征方法,对Fe-Ni-Cr微观结构的演变以及相变结晶过程进行了详细的研究,为Fe-Ni-Cr材料的研究应用丰富了理论基础,对改善提升其软磁性能具有重要意义。研究结果表明:7组不同
电力系统属于国家的关键基础设施,与国家经济的发展以及人民的日常生活关联紧密。电力系统在信息化、网络化、智能化的同时,也引入了信息安全威胁。入侵检测作为电力系统安全防护的关键步骤,及早发现电力系统遭受的攻击行为并采取安全防护措施可降低攻击所造成的影响。为此,本文在分析电力信息物理系统(CyberPhysical System,CPS)结构的基础上研究了其对应的漏洞和安全威胁,并设计了一种基于区域划分
针对纳米结构STM图像的分割,旨在从复杂背景中识别出纳米结构区域,进而辅助其物理特性参数的分析。为提升纳米结构图像分割精度,采用了一种基于神经网络的STM图像分割方法。以量子点等纳米结构为感兴趣区域,展开图像分割实验。其中主要涉及图像预处理、分割及物理特性参数识别等工作。预处理实验主要包含灰度化、降噪、除污及数据增强等流程。首先,根据图像特性,设计一种基于自适应权值的图像灰度化算法,以降低数据维度
随着信息通信行业对微波器件的宽带、小型化以及集成化等性能的要求越来越高,基片集成波导(Substrate Integrated Waveguide,SIW)结构以其显著的优势,一度成为微波领域里的研究热点。本文以基于SIW结构的微波无源器件小型化技术为研究课题,研究了慢波基片集成波导(Slow-Wave Substrate Integrated Waveguide,SW-SIW)结构及其在双频宽带
本文采用磁控溅射在石英玻璃衬底上先后溅射一层硅膜和锰膜,再采用后退火的方法制备高锰硅(High Mangnese Silicon,HMS)。研究了锰和硅的溅射时间比、热处理工艺和溅射工艺对石英玻璃上制备高锰硅的影响。提出了最合适的锰硅时间比、热处理条件和溅射参数,成功的制备了高质量的单一相高锰硅薄膜。用X射线衍射仪(XRD)、扫描电子显微镜(SEM)和四探针测试仪对制备的高锰硅薄膜的结构、形貌和性
近几十年来铁酸铋由于其在室温下表现出良好的多铁性能及光学性能使其在存储器以及光伏领域受到广泛的关注。但是较大的漏电流密度以及较弱的磁电性能限制了他的应用,众所周知通过A、B位掺杂可以改善这些缺陷并提高性能,本文使用溶胶凝胶法合成了A位单掺Gd、AB位Gd、Mn共掺杂以及AB位Gd、Co共掺杂三种体系的BiFeO3薄膜主,主要研究结果如下:用溶胶凝胶法在Pt/Ti/SiO2/Si和ITO衬底上合成了
神经网络作为一种具有高度并行处理能力的网络结构,在解决工程问题方面已发挥重要作用,但将其与种群进化结合的研究较为罕见。为此,在探讨果蝇视觉系统的信息处理机制基础上,研究改进型前馈果蝇视觉神经网络,并将其与梯度下降法及种群进化思想结合,研究求解最优化问题的果蝇视觉神经网络优化算法。研究工作不仅有助于获得介于计算机视觉与智能优化之间的交叉性研究成果,而且能为最优化问题的解决提供并行处理方案。主要工作和