论文部分内容阅读
随着物联网技术的发展,数字图像、视频等数据量呈爆炸性增长,图像数据分析面临着越来越大的挑战。目标检测是一项重要的图像处理技术,其主要任务是识别并定位图像中感兴趣的目标。目前基于深度学习的目标检测技术在精度和速度上没有做到很好的均衡,并且庞大的计算量使其难以在算力有限的嵌入式设备上达到实时推理运行。本文着重于实时目标检测算法的研究,并探索嵌入式设备上的推理优化方案,主要工作有三点:(1)提出了一种基于视觉注意力机制的多尺度目标检测算法(Attentional Receptive Field Fusion Single Shot MultiBox Detector,ARFSSD)。ARFSSD使用了基于感受野融合与扩张卷积的残差网络(Receptive Field Based Dilated Residual Networks,RF-DRN)和通道注意力模块(Channel Attention Module,CAM)。其中RF-DRN通过增大或融合多尺度感受野增加了特征的全局上下文信息;CAM通过分配特征通道间的注意力降低了特征通道间的相关性。(2)针对NVIDIA Jetson TX2嵌入式计算设备,设计了一种轻量级目标检测网络ARFSSD-Lite,通过降低特征提取网络的深度与输入分辨率,减少了计算量。(3)基于CUDA和TensorRT设计了实时目标检测算法推理优化方案,通过CUDA多线程设计,存储管理与通信优化,量化与自定义插件层设计等方法在Jetson TX2上构建了一套实时目标检测系统。实验分析表明,本文提出的实时目标检测算法和推理优化方案都达到了预期的目标:(1)ARFSSD在VOC2007数据集上,达到了78.6%的检测精度和109.9FPS的检测速度,精度和速度都有提升。(2)ARFSSD-Lite在VOC2007数据集上达到了73.7%的检测精度和217.8FPS的检测速度。(3)对于Jetson TX2,经过推理优化后的ARFSSD-Lite在VOC2007数据集上仅损失了0.6%的精度,速度从优化之前的16.7FPS提升到了35.2FPS;在自行构建的面包数据集上达到了90.6%的检测精度和47.6FPS的速度,进一步验证了本文所提出的实时目标检测算法和推理优化方案的有效性。