论文部分内容阅读
随着深度学习的飞速发展,卷积神经网络被广泛应用于图像识别和物体检测.然而,基于神经网络的算法计算量和资源密集,难以在嵌入式系统中使用.本文基于轻量化的神经网络模型提出了一种可扩展、低功耗、资源占用少的加速器架构.在带有Zynq器件的FPGA平台上,使用Xilinx Vivado的高级综合工具(HLS)实现加速器设计.