基于FPGA的复合卷积神经网络算法加速设计

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:swxylq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉是人类获得外界信息的重要手段,对于因视觉通路病变或受损的病患,盲人辅助系统能够有效的帮助其完成部分日常生活中的视觉任务。随着卷积神经网络等新技术的应用,盲人辅助系统能够对盲人所提供的帮助越来越丰富。但是深度学习等新技术在应用过程中存在计算消耗大、计算时间长等问题,这使得卷积神经网络难以在盲人辅助系统等轻量型平台中实现,因此对FPGA平台下的轻量型卷积神经网络进行模型和电路的协同化设计具有重要的意义。本文以GoogLeNet模型和SqueezeNet模型为基础,针对原有模型在FPGA平台中并行度低、流水效率差等问题,从硬件实现的角度出发提出了改进的并行化Inception算法模型。通过对GoogLeNet模型和SqueezeNet模型进行分析,调整Inception算法的数据流计算流程,修改了原始模型中的网络结构,并重新剪裁获得了一个适于FPGA平台部署的高准确率、轻量型卷积神经网络模型。通过与RCNN-A2模型、Maxout模型、DSN模型等其他经典的轻量级网络模型在标准CIFAR数据集上进行对比测试,实验结果表明了改进的Inception模型获得了 90.04%的准确率,比Maxout模型高准确率高2.62%、比P ReLU模型准确率高2.13%、比DSN模型准确率高0.63%,与RCNN-A2模型准确率接近,表现出了较高的识别精度和复杂场景下的鲁棒性。同时具有与其他卷积神经网络相比更加出色的硬件亲和度,在卷积神经网络的FPGA实现中具有较高的加速优势。本文完成了改进的并行Inception模型在FPGA中的硬件实现。通过采用指令控制和多状态计算等手段,将改进后的网络模型部署在基于FPGA设计的专用加速模块中,实现网络的循环运算。利用Vivado Simulation仿真工具对各个功能模块进行仿真,然后在ZCU-120开发板上搭建相应的硬件测试平台对模型进行功能验证。本文采用串口通信的方式将预先编辑的测试向量输入到算法的计算模块中,通过使用Xilinx自带的在线逻辑分析仪抓取关键节点的数据,与TensorFlow的计算结果进行对比分析。最终硬件测试结果表明,本文所提出的并行Inception模型具有显著的硬件加速性能和鲁棒性,计算效果与软件计算效果相同,在200MHz的系统时钟下获得了663 FPS峰值处理速度。
其他文献
当今国际社会,艺术品金融化发展已经较为完善,而在我国,其依然是一个全新的行业。本文着重分析了现阶段我国艺术品金融化发展现状及其特点,以及在发展过程中存在的不足,并针
因有前车之鉴才未重蹈覆辙对近期泰铢危机的反思■许峰1997年7月2日,以泰国政府和金融当局宣布转变外汇管理体制和提高贴现率为契机,酝酿已久的泰国金融危机终于显性化,并逐渐波及到东
建立了防冻液中乙醇含量的气相色谱分析方法。采用Agilent7890气相色谱仪,FID检测器,DB-170160m×0.32mm×0.25μm毛细管色谱柱,以异丁醇为内标,以乙腈为溶剂。内标法对防冻
东南亚金融危机的成因及其对中国的启示肖鹞飞自1995年初墨西哥货币比索危机解除以来,今年年中又暴发了东南亚金融危机。在国际投机资本的压力下,1997年7月2日,泰国政府决定放弃长达13年的与
果蔬大量上市的季节,价格和销路成为农户的“心头大事”.对于山东潍坊周边农户而言,这个收获季终于能够松下一口气.他们不需要再四处打听收购商的信息,转而代之的是运到附近
中国经济体制改革的目标是在宏观上建立和完善社会主义市场经济体制。相应地,在微观领域,经过放权让利、承包制、股份制试点的实践探索和对国外企业模式的比较与理论总结,现代公
目的分析基于各类生物网络的复杂疾病致病基因预测算法,总结其优势及不足之处,提出改进思路及未来的研究方向。方法深入分析当前基于网络的疾病基因预测算法原理,包括不同生
文章首先介绍了遥感卫星立体影像传感器模型的主要类型;然后从模型数学表达式、对影像的处理精度和应用范围等几个方面对目前几种主流传感器模型进行了分析;最后比较了不同传
AIIB作为真正由发展中国家发起、主导的政府间多边金融机构,其成功筹建、发展壮大对亚洲基础设施互联互通、"一带一路"建设及国际金融体系改革创新具有重要意义。本文在全面
小麦麸皮水溶性阿拉伯木聚糖(WEAX)对面食品质的改良效果取决于其固有的结构特性。本文利用乙醇分级沉淀法从麦麸中提取不同结构组成的WEAX,在明确其结构的基础上,研究其对馒