论文部分内容阅读
随着深度学习的迅速发展,深度卷积神经网络在计算机视觉领域取得了快速发展。目标检测技术作为计算机视觉领域中的中流砥柱是一项具有挑战性的任务,并广泛应用在了无人驾驶、监控安防等领域。当前提出的目标检测算法对形变遮挡目标、小目标的检测精度不佳,容易出现误检、丢失检测的情况。目标检测算法的检测精度与速度之间达到平衡成为当前的研究热点。本文针对目标检测算法中一阶段目标检测算法YOLOv3的不足之处进行了分析与改进。YOLOv3算法相比于YOLOv2算法提升了对小目标的检测精度,但是对中大型目标的检测精度有所下降,对扭曲变形目标的检测精度还存在不足。针对YOLOv3算法存在的不足之处进行了改进:(1)进一步提升小目标和中大型目标的检测性能,本文提出的GA-YONET算法采用了生成对抗网络(Generative Adversarial Networks)做图片的超分辨率操作,并提出了门卷积机制和通道注意力机制更好的定位特征图中的小目标。一方面可以提升对小目标的检测精度;另一方面也可以作为一种数据增强操作。(2)提升不同遮挡程度下的目标检测性能,本文采用在GA-YONET算法的生成对抗网络中对特征图的特征值加掩膜处理,掩膜覆盖下的特征值置为0。针对扭曲变形的目标检测采用的是对特征图进行横向或者纵向拉伸、旋转等操作。(3)对于损失函数的改进:为了更好的提升对目标目标的检测精度,本文首先对目前常用的损失函数如KL(Kullback-Leibler divergences)散度和 JS(Jensen-Shannon divergences)散度的数学思想进行了分析,发现KL散度和JS散度在作为深度学习的损失函数时存在缺陷。因此本文采用基于距离的Wasserstein Distance作为损失函数。Wasserstein Distance损失函数优势在于该函数可以较好的刻画两个分部之间的真实距离,并且为了减小训练阶段的正负样本的数量差异,本文在Wasserstein Distance损失函数中加入了高斯惩罚项,通过修改权重使得深度神经网络重点关注分类错误的损失。为了防止梯度爆炸对权重的更新操作进行了优化,并加入了拉普拉斯平滑降低梯度回传时梯度值为0的情况发生。通过对上述YOLOv3算法存在的不足进行改进,GA-YONET一阶段目标检测算法提升了对小目标,遮挡变形目标的检测精度,在MSCOCO 2012数据集上分别有不同程度的效果提升,并且将GA-YONET算法移植到无人车中在户外真实场景中也进行了效果演示,包括夜间和雪中场景的检测,取得了良好的检测效果。证实了本文对YOLOv3算法做出改进方法的有效性。