论文部分内容阅读
视觉是人类获得外界信息的重要手段,对于因视觉通路病变或受损的病患,盲人辅助系统能够有效的帮助其完成部分日常生活中的视觉任务。随着卷积神经网络等新技术的应用,盲人辅助系统能够对盲人所提供的帮助越来越丰富。但是深度学习等新技术在应用过程中存在计算消耗大、计算时间长等问题,这使得卷积神经网络难以在盲人辅助系统等轻量型平台中实现,因此对FPGA平台下的轻量型卷积神经网络进行模型和电路的协同化设计具有重要的意义。本文以GoogLeNet模型和SqueezeNet模型为基础,针对原有模型在FPGA平台中并行度低、流水效率差等问题,从硬件实现的角度出发提出了改进的并行化Inception算法模型。通过对GoogLeNet模型和SqueezeNet模型进行分析,调整Inception算法的数据流计算流程,修改了原始模型中的网络结构,并重新剪裁获得了一个适于FPGA平台部署的高准确率、轻量型卷积神经网络模型。通过与RCNN-A2模型、Maxout模型、DSN模型等其他经典的轻量级网络模型在标准CIFAR数据集上进行对比测试,实验结果表明了改进的Inception模型获得了 90.04%的准确率,比Maxout模型高准确率高2.62%、比P ReLU模型准确率高2.13%、比DSN模型准确率高0.63%,与RCNN-A2模型准确率接近,表现出了较高的识别精度和复杂场景下的鲁棒性。同时具有与其他卷积神经网络相比更加出色的硬件亲和度,在卷积神经网络的FPGA实现中具有较高的加速优势。本文完成了改进的并行Inception模型在FPGA中的硬件实现。通过采用指令控制和多状态计算等手段,将改进后的网络模型部署在基于FPGA设计的专用加速模块中,实现网络的循环运算。利用Vivado Simulation仿真工具对各个功能模块进行仿真,然后在ZCU-120开发板上搭建相应的硬件测试平台对模型进行功能验证。本文采用串口通信的方式将预先编辑的测试向量输入到算法的计算模块中,通过使用Xilinx自带的在线逻辑分析仪抓取关键节点的数据,与TensorFlow的计算结果进行对比分析。最终硬件测试结果表明,本文所提出的并行Inception模型具有显著的硬件加速性能和鲁棒性,计算效果与软件计算效果相同,在200MHz的系统时钟下获得了663 FPS峰值处理速度。