论文部分内容阅读
为满足低功耗、低时延的目标检测任务,本文针对以MobileNet 为代表的轻量化卷积网络,基于FPGA平台设计一种轻量化神经网络加速器。本文通过优化DW、PW轻量化模块以及实现常用的卷积、RELU等功能模块,满足了神经网络加速器低功耗、低时延的要求,同时本文基于指令设计的神经网络加速器支持MobileNet及其各种变种。通过上位机配置YoloV3 tiny(不含轻量模块)指令和yoloV3 & MobileNet(含轻量模块)指令的目标检测实验,该神经网络加速器可达到较快的推断速度,YoloV3 tiny网络结构达到85FPS,yoloV3 & MobileNet达到62FPS。