论文部分内容阅读
目标检测是计算机视觉领域的重要方向,随着深度学习方法及相关硬件设备的发展,它在自动驾驶、智能监控、智能手机等方面都有着广泛的应用,具有重要的研究意义。
基于无锚框深度学习的目标检测是一种主流的单阶段目标检测算法。融合多层监督信息的沙漏网络结构能够显著提升无锚框目标检测算法的精度,然而其速度却远低于同层次的普通网络的速度,并且不同尺度目标间的特征会互相干扰。针对上述问题,本文提出了一种非对称沙漏网络结构的目标检测算法。该算法在融合不同网络层的特征时不受形状大小的约束,能够快速且高效地抽象出网络的语义信息。针对不同尺度目标检测问题,本文设计了一种多尺度输出的沙漏网络结构用来解决目标间互相干扰的问题,并使用一种特殊的非极大值抑制算法精细化输出的检测结果。
另一方面,在嵌入式与移动设备上,现有的主流小型检测模型速度虽快但一般无法达到较高的精度。本文在非对称沙漏网络的基础上,提出针对无锚框目标检测的模型剪枝与混合精度训练两种方法,使网络模型在保持精度的条件下大幅提高其速度。最后,本文将此模型迁移到Arm设备上并成功地在巡检机器人上部署,取得了良好的应用效果。
实验结果表明,本文所提算法的精度在COCO和VOC两个主流数据集上均达到较好水平,同时两种模型加速方法进又一步提高检测速度与降低训练资源占用,取得了既好又快的效果。
基于无锚框深度学习的目标检测是一种主流的单阶段目标检测算法。融合多层监督信息的沙漏网络结构能够显著提升无锚框目标检测算法的精度,然而其速度却远低于同层次的普通网络的速度,并且不同尺度目标间的特征会互相干扰。针对上述问题,本文提出了一种非对称沙漏网络结构的目标检测算法。该算法在融合不同网络层的特征时不受形状大小的约束,能够快速且高效地抽象出网络的语义信息。针对不同尺度目标检测问题,本文设计了一种多尺度输出的沙漏网络结构用来解决目标间互相干扰的问题,并使用一种特殊的非极大值抑制算法精细化输出的检测结果。
另一方面,在嵌入式与移动设备上,现有的主流小型检测模型速度虽快但一般无法达到较高的精度。本文在非对称沙漏网络的基础上,提出针对无锚框目标检测的模型剪枝与混合精度训练两种方法,使网络模型在保持精度的条件下大幅提高其速度。最后,本文将此模型迁移到Arm设备上并成功地在巡检机器人上部署,取得了良好的应用效果。
实验结果表明,本文所提算法的精度在COCO和VOC两个主流数据集上均达到较好水平,同时两种模型加速方法进又一步提高检测速度与降低训练资源占用,取得了既好又快的效果。