论文部分内容阅读
汽车作为最常用的交通工具,在我们日常生活中广泛地使用。无论是在繁华的市区,还是宁静的郊区,都可以看到各式各样的车辆在马路上行驶。但是汽车车辆的数量过于庞大,给社会造成了许多问题,比如交通事故,交通拥堵,停车空间等等。近年来,无人驾驶技术得到了快速发展,而计算机视觉作为无人驾驶技术中的一个重要环节,也有了不少突破。研究人员使用计算机视觉与深度学习相结合的方法,利用卷积神经网络对图像进行特征提取,并使用多种机器学习的方法提取特征信息对目标物体进行分类和回归,使得车辆的检测速度和准确率都提升了不少。但是当前对车辆的目标检测方法并不能很好的保持检测速度与准确度两者的优势,比如Faster R-CNN检测方法,在保证准确比较好的情况下,检测速度却不能保证实时效果。在YOLO和SSD检测方法中,能够保证检测的速度较快,但准确度却不能保证较好水平,会出现比较多的错误判别。因此,这几种目标检测方法都不能很好的应用在实际当中。针对当前车辆检测方法的不足,本文提出了一种基于SSD的改进模型DMRSSD,以多卷积核多感受野的方式对SSD检测判别用的6个特征图进行改进,同时以密集的连接方式把高低层的特征信息融合在一起,同时对模型的训练损失函数和优化函数做改进。本文的基于SSD的改进模型DMRSSD的创新方法特点和研究工作内容主要有:(1)在原始SSD输出的6个特征图中,长宽较大的两个特征图使用多卷积核多感受野的卷积神经网络模块MR-Block再次提取特征,对特征图中间的部分使用较小的卷积核和卷积核滑动窗口提取特征,对周围部分使用扩张卷积核和较大的卷积核滑动窗口提取特征,再把不同卷积核提取的特征信息结合一起,使得输出的特征图语义信息更加丰富,即对中间部分提取更细致的特征信息,同时也兼顾周围部分的特征信息。(2)对DMRSSD输出的6个特征图使用密集连接方式,与Dense Block中特征图的密集连接方式一样,这6个特征图每个特征图生成的时候,都会有前面较大的特征图进行直接参与。这样可以使得特征信息重利用,使得后面生成特征图的特征信息更具有关联性。(3)在模型训练的时候,使用Focal Loss损失函数取代原来训练用的分类交叉熵损失函数,使得正负样本更加均衡,提高模型训练结果的精度。并使用AdaBound优化函数对模型训练的参数进行动态调节,加快训练时损失函数的收敛速度,同时也提高模型的检测准确度。实验结果表明,使用改进后的DMRSSD模型对KITTI数据集进行车辆目标检测,mAP由SSD的82.79%提升到90.57%,提升了7.78%。