基于ZYNQ的卷积神经网络的硬件加速研究与实现

来源 :青岛大学 | 被引量 : 0次 | 上传用户:shidai19860115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络是人工智能领域的一个重要研究方向,因其独特的网络结构使其尤其擅长视频图像处理。其通过局部感知和权值共享等特有方法,改善了传统算法在图像处理领域的参数过多等问题。但是由于卷积神经网络的卷积特性,在图像处理过程中仍然需要进行大量的卷积运算,这种海量的运算使得网络运行速度受到严重制约,影响了卷积神经网络在实时、小型嵌入式系统中的应用。因此对卷积神经网络的加速设计也成了研究的热门方向之一。本文从卷积神经网络模型的结构特点出发,结合ZYNQ芯片的ARM+FPGA的异构结构优势,从软件实现和硬件加速两个方面重新分析了卷积神经网络模型在ZYNQ中并行实现的可行性,设计了一种基于ZYNQ平台的卷积神经网络的硬件加速系统,并用该系统实现了基于CIFAR-10数据集的图像分类识别功能。在本系统中为了提高卷积神经网络在ZYNQ平台上的运行速度,本文采用了一种通过ZYNQ的PL端即FPGA,以硬件电路实现卷积神经网络的加速方案。但是,由于ZYNQ平台PL端硬件逻辑资源有限,无法通过硬件电路的方式实现完整的卷积神经网络,因此,仅将卷积运算这部分功能综合到PL端通过硬件电路加速实现。本文详细分析了卷积神经网络的模型结构,给出了模型中关键层实现算法原理、计算公式等。然后使用Vivado工具和Verilog语言设计了图像预处理IP核等,并完成了系统硬件工程的搭建。在完成硬件工程搭建的基础上,参考经典网络模型LeNet-5,针对ZYNQ平台资源有限的特点对设计了一个结构相对简单的卷积神经网络模型。然后使用SDx工具在搭建完成的硬件平台上使用C语言用软件的方式实现了卷积神经网络,并在软件实现卷积神经网络的基础上,对卷积层的软件源码进行了详细分析,从理论层面上找出了限制卷积神经网络运行速度的关键部分即卷积运算模块,并使用SDx工具通过实验验证了理论分析的正确性。接着通过SDx工具针对卷积运算采用流水线化、循环展开、数组分割等加速方法,设计实现了高效的卷积运算IP核,最后使用SDx工具将生成的IP核综合到ZYNQ的PL部分实现了整个卷积神经网络的加速。实验结果表明本文所采用的这种基于ZYNQ的卷积神经网络硬件加速方法可以有效的实现卷积神经网络的硬件加速功能,并且在基于CIFAR-10数据集的应用测试中也表现出了良好的加速性能。
其他文献
1899年中韩签订了《中韩通商条约》,结束了甲午战争以来的非正式关系,进入了以近代条约为基础的对等关系。其条约的第二条规定双方互派领事,由此1902年大韩帝国在"皇都"设立
自2013年余额宝上线以来,经过短短几年,互联网货币基金市场运行得如火如荼,更多的投资者加入了进来进行零钱理财。为了全面评价这些基金产品的业绩,本文利用三大经典指数和数
目的 探讨腰椎骨质密度(BMD)与年龄、性别、体质参数及腹部皮下脂肪(SAT)、内脏脂肪(VAT)的关系。方法 纳入健康志愿者或慢性腰腿痛患者111人(男56人,女55人),测量受检者身高、体质量
新型的科技发展对社会进步有着促进作用,其中无线wifi技术在当前人们的生活中起到了重要作用,无线wifi网络通信节点在分布的地理位置方面呈现出随机分布的特征,加强对无线wifi最
职业高中烹饪教学与信息技术相整合,能起到较好的教学效果,一改传统的教学模式,能让学生更好的理解教学内容,介绍了在烹饪教学中可以把现代教育技术作来学生个体学习的工具、
学校德育具有长期性、复杂性和艰巨性的特点,不是某一门思想教育课的任务,而是所有学科都应负的责任;也不仅仅是政治课教师的任务,而需要全体教师有意识、有目的地将德育渗透
中国区域文化可以分为四个维度的区域亚文化:行政与历史区域文化、城镇与乡村区域文化、生态与地理区域文化、种族与民族区域文化。最原生态的区域亚文化标志和标识就是地方生
目的对胰腺神经内分泌肿瘤的CT影像特征进行分析。方法选取我院2013年1月~2018年1月的胰腺神经内分泌瘤患者42例,其所有患者全部都进行了CT平扫和动态增强扫描检查,对患者的C
文章从学生主体:青年自我成长的"定盘星";教师队伍:思政教育队伍的"引路人";课程载体:高等教育发展的"动力源";社会协同:青年成就事业的"支持者"四个方面论述了习近平新时代
根据鲁家坪组的岩性、岩相和变质程度的变化以及区域分布特征,原定义所包含的岩石内容过于庞大,混淆了岩石地层单位和年代地层单位。通过对鲁家坪组的命名地点和标准剖面所在地