基于HLS的高效深度卷积神经网络FPGA实现方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:poloya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DCNN(Deep Convolution Neural Network)是深度学习中的一项关键技术,已经被广泛应用于目标检测、图像分类及语音识别等智能处理领域。随着需求的不断发展,需要设计具有小尺寸、低功耗、快速度、高精度的实时处理系统,然而DCNN由于层数深,参数多,导致计算量和数据量很大,难以满足应用需求,必须研究并设计具有更低复杂度的网络结构及其高效并行架构。FPGA(Field Programmable Gate Arrays)相比运行串行指令流的CPU(Central Processing Unit)可以实现并行操作,且有着比GPU(Graphics Processing Unit)更高的性能功耗比,是目前解决DCNN实时处理的主流平台。但传统基于RTL(Register Transfer Level)的FPGA应用开发方式灵活性、可移植性和可扩展性低,极大影响了开发效率。HLS(High Level Synthesis)可以将高级抽象语言如C、C++和System C自动转化为硬件描述语言(HDL:Hardware Description Language)VHDL/Verilog,为FPGA高效设计提供了新的思路和工具。本文通过对现有相关研究的分析、总结和改进,给出了一系列在软件层面上如何构建和训练小巧高效且利于硬件加速的网络方法,在FPGA实现时如何减少资源、降低功耗及提高速度的方法,以及在HLS中如何增加设计灵活性、可移植性和可扩展性的方法,具有很好的实用价值。并结合这些方法构建和训练了一个网络,命名为EfficientNet,使用HLS在FPGA上对其进行了推断加速。通过与其他网络和平台的对比,验证了这些方法的有效性。本文的主要工作和贡献如下:1)设计实现了一种轻量化的深度学习网络EfficientNet。针对传统网络参数量及计算量大且不利于硬件加速的问题,本文在保证精度的前提下,分析了以深度可分离卷积代替标准卷积、以步进代替池化、以平均池化代替全连接的方法,提出了尺寸不变通道增减交替的方法,并对这些方法进行了集成,从而构建了一个低复杂度的DCNN网络,并命名为EfficientNet。实验结果表明EfficientNet在公开的Flower_photos数据集上的分类精度为89.3%,相比Inception-v3,在参数量和计算量减少至约五、六十分之一的情况下,精度损失仅有5.7%。2)在FPGA上设计实现了EfficientNet的推断加速系统。围绕减少资源、降低功耗和提高速度这些方面,本文引入了分块机制,选择和设计了适用于本文的数据重利用方式,采用了流式输入卷积电路,提出了深度流水并行架构,并结合这些方法对本文设计的网络EfficientNet在FPGA(ZCU102开发板@244Mhz)上进行了推断加速。实验表明EfficientNet FPGA推断加速系统仅占用了ZCU102开发板上不到一半的资源,处理速度可达512?512@36fps,达到了实时处理的要求,比CPU([email protected]*2六核)快约66倍、比GPU(Tesla K80)快近2倍,同时功耗相比GPU低近2倍。3)编写了DCNN函数模板库并提出了一种设计空间探索模型Design Space Exploration。为解决传统FPGA设计灵活性、可重用性和可扩展性低的问题,本文充分利用了HLS基于C开发的优势,使用C++的模板功能编写了DCNN所需的部分函数并汇集成库,参数化了各配置信息,规范了输入输出接口,以及提出了一种设计空间探索模型Design Space Exploration。使得后续研究人员可以很方便地对该HLS库修改和扩充,并且不用局限于本文所设计的EfficientNet架构,可以根据自身需求按本文给出的评估方式去调用本文编写的函数库并设置参数,来实现适用于自己的网络。
其他文献
近年来,我国经济持续增长,建筑企业取得了更大的发展空间,我国建筑工程建设规模在不断扩大,建设数量在不断增长。为了有效保障建筑企业的经济效益,加大建筑工程中资金的有效
激励机制是企业人力资源管理的重要手段,在调动员工工作积极性,激发员工个人潜能,提高员工工作绩效等方面有着不可忽视的作用。本文在分析企业管理运用激励机制必要性的基础
随着中国TD-LTE网络的建设和完善,竞争激烈的TD-LTE网络逐步启动,TD-LTE网络质量面临前所未有的挑战。要建立一个用户满意度高的精品网络,我们必须拥有良好的无线网络优化技术。特别是在终端的初始接入网络中,接入优化技术更为重要。对于TD-LTE无线通信网络,接入是整个网络运行的基础,接入成功率是评估网络性能好坏的重要指标。提高接入成功率是TD-LTE网络优化的重要任务之一。本文重点研究TD
目的:为了生物安全实验室空气污染防护,降低泄漏扩散和表面污染扩散的风险.方法:逐点监测高效过滤器,一旦高效过滤器发生泄漏能立即捕获漏点,并同步进行声光报警并迅速关闭密闭
为解决基于单图像噪声水平评估算法抗干扰能力低和执行效率不高的问题,提出一种基于多图像先验知识的噪声水平评估算法.首先,在具有广泛代表性且未受噪声干扰图像集合上添加
本文介绍了DA2l型2lOt凹底平车的主要用途、主要技术特点、主要性能参数及尺寸、4主要结构及材料、鉴定性试验情况及运用情况。
本文在利用NOAA/AVHRR数据反演得到1982~2000年青藏高原地区地表反照率时空分布的基础上,分析了地表反照率的时空变化及其与温度和降水之间的关系,得到地表反照率与温度和降水
著名教育家朱永新认为:“教师应该努力挖掘教师职业的内在美,坚信自己所从事的是一个影响人一生的、值得为之奋斗一生的事业。这样,你才会爱它,才会全身心地投入。你只有爱教育事
报纸
春节长假新冠肺炎疫情暴发,利空风险在春节后首个交易日集中释放,国内橡胶期货价格大幅回落。虽然胶价展开超跌反弹走势,但是消费数据惨淡令胶价上涨乏力。近期东非蝗灾蔓延,看似
报纸
针对矿山裸露岩质边坡植被恢复成本高的问题,以尾矿砂为基础材料,研制尾矿植被混凝土,采用正交试验,研究水泥(A)、小麦秸秆(B)、蘑菇渣(C)和粘合剂(D)4个因素在不同水平下对