基于深度学习的实时目标检测算法研究与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户:qgdjyahaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物联网技术的发展,数字图像、视频等数据量呈爆炸性增长,图像数据分析面临着越来越大的挑战。目标检测是一项重要的图像处理技术,其主要任务是识别并定位图像中感兴趣的目标。目前基于深度学习的目标检测技术在精度和速度上没有做到很好的均衡,并且庞大的计算量使其难以在算力有限的嵌入式设备上达到实时推理运行。本文着重于实时目标检测算法的研究,并探索嵌入式设备上的推理优化方案,主要工作有三点:(1)提出了一种基于视觉注意力机制的多尺度目标检测算法(Attentional Receptive Field Fusion Single Shot MultiBox Detector,ARFSSD)。ARFSSD使用了基于感受野融合与扩张卷积的残差网络(Receptive Field Based Dilated Residual Networks,RF-DRN)和通道注意力模块(Channel Attention Module,CAM)。其中RF-DRN通过增大或融合多尺度感受野增加了特征的全局上下文信息;CAM通过分配特征通道间的注意力降低了特征通道间的相关性。(2)针对NVIDIA Jetson TX2嵌入式计算设备,设计了一种轻量级目标检测网络ARFSSD-Lite,通过降低特征提取网络的深度与输入分辨率,减少了计算量。(3)基于CUDA和TensorRT设计了实时目标检测算法推理优化方案,通过CUDA多线程设计,存储管理与通信优化,量化与自定义插件层设计等方法在Jetson TX2上构建了一套实时目标检测系统。实验分析表明,本文提出的实时目标检测算法和推理优化方案都达到了预期的目标:(1)ARFSSD在VOC2007数据集上,达到了78.6%的检测精度和109.9FPS的检测速度,精度和速度都有提升。(2)ARFSSD-Lite在VOC2007数据集上达到了73.7%的检测精度和217.8FPS的检测速度。(3)对于Jetson TX2,经过推理优化后的ARFSSD-Lite在VOC2007数据集上仅损失了0.6%的精度,速度从优化之前的16.7FPS提升到了35.2FPS;在自行构建的面包数据集上达到了90.6%的检测精度和47.6FPS的速度,进一步验证了本文所提出的实时目标检测算法和推理优化方案的有效性。
其他文献
或许,人们相信这样一些事实: 没东西或少东西,曾经是我国经济生活中长期存在的尖锐的矛盾。从1952年到1978年,虽然吃、穿、用等商品零售总额平均每年递增6%左右,但是商品短缺
财务能力是企业能力系统重要的构成要素,对企业生存与发展具有重大的现实意义。企业的财务核心能力体现在其可持续盈利成长能力,其能够对企业财务指标与能力予以综合反映。饲
国学大师季羡林先生有一篇短文《没有新意,不要写文章》,读后启发很大,没有新意。尚不足以写文章,那么对新闻而言,没有新意,就更不足以写新闻了。作为一名新闻工作者,按照这一标准.回
灵感是英文inspirationd音译。柏拉图在他的《伊安篇》中指出:“同一个诗人的不同创作,有的成功.有的失败;同一个诗人解说不同的诗.效果也不一样,这种现象说明了什么.这就是因为文艺
钙化防御是一组以外周小血管钙化而导致的血管疾病,常发生于维持性血液透析的患者,该病临床报道尚不多见,现将我科所见一例报道如下.
绿色农业是基于农产品质量安全保证,实现生态、经济以及社会发展等多方面综合效益的一种全新农业发展模式。绿色农业与国家食品安全保障、资源保护、维持生态平衡、增加国民经济收入紧紧相连。党的十九大报告指出,要推进绿色发展。要提供更多优质生态产品以满足人民日益增长的优美生态环境需要。发展现代绿色农业是突破农业发展阻碍,保障我国农业稳定、可持续、和谐化发展的有效途径。2019年中央一号文件明确指出,要大力发展