基于ZYNQ的卷积神经网络软硬件协同设计研究与实现

来源 :大连海事大学 | 被引量 : 8次 | 上传用户：rongsiyouyu

【摘要】

：

卷积神经网络作为深度学习领域的核心算法,将特征提取与分类进行结合,与人工提取特征进行分类相比,具有更高的检测精度。由于其网络结构复杂,每层包含大量并行的乘加运算,需

【作者】

：

王春林

【出处】

：

大连海事大学

【发表日期】

：

2020年01期

【关键词】

：

卷积神经网络 ZYNQ 软硬件协同设计脉动阵列 Vivado HLS

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

卷积神经网络作为深度学习领域的核心算法,将特征提取与分类进行结合,与人工提取特征进行分类相比,具有更高的检测精度。由于其网络结构复杂,每层包含大量并行的乘加运算,需要硬件平台具有强大的并行计算能力。FPGA作为一种可编程逻辑器件,具有高并行度和可编程性等优势,可针对不同的算法进行并行加速,成为实现卷积神经网络的一种重要的选择。本文基于Xilinx公司的ZYNQ芯片对卷积神经网络进行硬件加速研究。对卷积神经网络的结构特点进行分析,采用软硬件协同设计的方式,充分发挥ARM和FPGA的优点。ARM端完成Linux操作系统的移植以及软硬件协同程序的设计;FPGA端实现卷积计算模块、深度可分离卷积计算模块、池化计算模块、数据输入和输出模块的设计。针对并行展开的方式易造成长广播、多扇入扇出的数据通路问题,本文采用脉动阵列代替并行展开,将长距离的数据通路转换为每个处理单元之间的短距离数据通路,并完成卷积计算模块的设计工作。在数据传输的实现方式上,采取多通道数据传输加中间缓存的方式,减少数据在DDR存储器和片上缓存之间传输的时间,并完成对数据输入和输出模块的设计。在硬件IP优化上,采用乒乓流水化操作方式执行各个模块,增加各模块的使用效率,减少硬件IP的总体运行时间。对浮点数据进行定点量化,减少片上存储资源的使用。针对FPGA片上存储资源无法存储全部权重参数和中间数据的问题,对卷积神经网络进行分块操作,并通过Roofline性能评估模型优化硬件结构以满足硬件资源限制。卷积神经网络硬件IP总体设计采用Vivado HLS高层次综合工具完成。实验采用Zedboard开发板,通过两种不同结构的卷积神经网络对软硬件协同设计进行评估。结果表明,本文利用ZYNQ芯片以软硬件协同设计的方式实现了卷积神经网络的硬件加速,在与浮点数据类型的检测精度基本一致的情况下,具有加速效果好,系统功耗低等优点。

其他文献

初中语文教学中口语表达能力培养研究

《义务教育语文课程标准》(2011年版)明确指出“培养学生正确理解和运用祖国语言文字的能力”是语文教学的核心任务。口语表达能力作为语言能力的重要组成部分,自然而然也就

学位

初中语文口语表达能力策略

新媒体时代报纸专题新闻如何找准定位——以科技日报抗疫专题报道为例

在媒体被各种新技术加持的当下,新媒体间的竞争激烈。以报纸为代表的传统媒体风光不再,甚至"纸媒已死"的论调也屡见不鲜。但对于一些必须活下去而且要活出个样儿来的报纸来说

期刊

新媒体时代专题报道专题新闻传统媒体科技日报纸媒活下去社会议题

呼伦贝尔沙地樟子松人工林土壤特性及根内真菌群落特征

沙地樟子松(Pinus sylvestris var.mongolica)是我国“三北”地区生态环境建设的重要绿化造林树种之一,但存在长势衰退、枝叶枯黄、病虫害爆发和更新障碍等严重的衰退问题。

学位

土壤理化酶活性特征真菌群落群落结构生态功能群

添加剂对超细颜料水性分散体系性能的影响

在水性超细颜料（C.I.颜料黄14）色浆中添加适当的助剂,配制成超细颜料水性分散体系;讨论了助剂对分散体系粘度和表面张力及消泡性的影响。试验结果表明,随1,3-丙二醇、1,4-丁二

期刊

染色印花分散体系超细颜料粘度表面张力dyeing printing disperse system superfine pigment viscos

基于ZYNQ的卷积神经网络软硬件协同设计研究与实现

其他学术论文