基于FPGA的CNN自动代码生成设计与实现

来源 :天津工业大学 | 被引量 : 5次 | 上传用户:zzx_520360
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(CNN)是一种非常重要的深度学习算法,由于通过它得到的结果识别效率高,因而得到了广泛的重视,成为众多科学领域的研究热点之一。除此之外,它在很多领域应用广泛,例如物体检测,图像识别等领域。目前,以应用为目标的深度学习相关算法发展迅速,这大大拓展了其应用的研究领域。一般来说,深度学习技术包括两个过程:数据训练和数据推断,而这两个过程对硬件资源的需求不同。GPU适用于数据训练阶段,而数据推断阶段则需要在移动设备上,尤其是FPGA。鉴于FPGA具有高性能、灵活、发展周期快速等优点,各种基于FPGA平台的深度卷积神经网络加速器相继被提出。虽然FPGA加速器已经表现出比通用处理器更好的性能,但是在移动设备上加速器设计的难度却并未被降低,尤其是在ARM+FPGA开发板上实现非常困难。现有CNN加速器在设计构造过程中,需要设计人员对CNN各个模块进行描述,传统的方式是通过编写代码或者利用高层次综合技术。显而易见,编写代码过程不仅难度大,而且还可能因为人为因素在编写代码时产生不必要的错误,从而导致开发周期长。这一关键问题得不到解决,就会导致加速器的设计难度加大。本文为了克服上述困难,设计和实现了如下内容:基于自动代码生成技术的CNN设计,其编码采用OpenCL。由于构成不同体系架构的CNN模块代码基本上是相同的,因此可以将自动代码生成技术应用到硬件卷积神经网络加速器上。该方法利用自动代码生成器自动地生成与卷积神经网络各模块相一致的OpenCL代码,然后再利用FPGA对生成的OpenCL代码进行模拟和仿真。本文中,主要从基于代码模板、系统网络结构文件、生成规则文件的自动代码生成器方面进行设计,从而构成自动代码生成系统。作为案例研究,我们在实验平台DE10_Standard FPGA开发板上搭建了基于自动代码生成的CNN,并将其与之前的方法作对比。在大约100MHz的时钟频率下,在FPGA板卡上我们实现并达到了0.224 GOPS/DSP的最高性能密度,这一结果优于之前大多数的方案。
其他文献
日本地震造成的核辐射,致使全球25个国家都对日本食品发布了"禁入令",给日本食品企业造成了不小的冲击,但给其他国家却留下了一个较大的市场空白。作为日本邻国的中国食品企业
目的:探讨奥美拉唑治疗消化性溃疡伴发慢性胃炎的临床疗效。方法:我院消化内科2009年7月~2011年8月收治的消化性溃疡伴发慢性胃炎患者194例,随机分为对照组与治疗组,每组92例,
目的分析消化性溃疡伴发慢性胃炎采用奥美拉唑治疗的临床效果。方法选取2015年8月~2017年6月收治的125例消化性溃疡伴发慢性胃炎病患者作为研究对象,分别纳入研究组和对照组,
粮食安全始终是关系我国国民经济发展、社会稳定和国家自立的全局性重大战略问题。保障我国粮食安全,对保障国家根本利益以及实现全面建设小康社会的目标,构建社会主义和谐社会
目的讨论单纯血浆置换和血浆置换联合血液滤过治疗重症肝炎的效果。方法选取我院治疗的重症肝炎的患者90例,随机分为两组,在实验组中使用血浆置换联合血液滤过治疗,在对照组
目的研究PBL结合LBL应用在呼吸内科学教学中的应用效果。方法选取选取2018年1月~12月在呼吸科实习的56名学生作为本次授课以及研究的对象,依据随机均分的方式将这些学生分为L
正确的掌握给药时间、服用方法不仅可以最大程度的保证药物发挥出药效,更保证了用药的安全性。
目的:探究奥美拉唑治疗小儿慢性胃炎并消化性溃疡的临床疗效。方法:选取2009年10月-2012年1月笔者所在医院收治的60例小儿慢性胃炎并消化性溃疡患者,采用随机数字表法将其分
本文介绍了我国目前商业建筑的能耗现状,分析了其中的节能潜力,并介绍了商业建筑节能的相关技术和市场机制。探讨商业建筑节能的可持续发展道路。