论文部分内容阅读
视觉障碍严重影响个人的日常生活,人工视觉假体的研究给盲人的视觉恢复带来希望。但由于电极材料、制造、植入等限制,目前可以植入患者体内的电极数量比较少,造成图像的分辨率比较低。因此,视觉假体的图像处理研究是视觉假体研究的核心之一。卷积神经网络在视觉假体上的应用可以辅助视觉假体更好的工作,本文研究卷积神经网络分类识别算法的设计在视觉假体上的应用以及卷积神经网络硬件加速器的实现。本文以VGG(Visual Geometry Group)模型为基础,结合视觉假体应用中输入图像为低分辨率图像对VGG模型进行裁剪,并在保证分类精度满足视觉假体需求的情况下,对网络进行优化,使其具有更快的预测速度和更小的硬件代价。首先针对VGG模型全连接层参数量在整个网络中的占比重,并且计算非常密集,采用全局平均池化层替代了全连接层,减少了网络中的参数;然后,为进一步压缩网络参数,本文对VGG模型进行通道压缩,将模型参数再次减少34.61%,获得了一个适合于视觉假体的轻量级网络。优化的VGG模型基于TensorFlow深度学习框架在CIFAR-10数据集上进行训练及测试,测试结果表明,优化后的VGG模型获得了 91.66%的准确率。与具有相似深度的神经网络模型相比,优化后的VGG模型比参考文献[38]的模型准确率高0.47%,具有相似的分类精度。本文完成了优化的VGG模型的硬件加速器设计,通过进一步分析优化后的VGG模型的特点,实现了多层卷积并行计算的硬件加速器架构。详细阐述了各功能模块的设计方案,使用verilog语言完成了加速器的设计,并对各功能模块进行modelsim功能仿真验证。然后在ZCU-102开发板上对加速器进行了功能验证,使用在线逻辑分析仪分析其正确性。并对设计的硬件加速器性能进行评估,评估结果表明,本文设计的硬件加速器在150MHz的时钟频率下,FPGA的处理速度可达到208FPS的峰值处理速度,该速度是CPU处理速度的13.87倍。