论文部分内容阅读
随着人工智能技术的发展,智能驾驶汽车成为了汽车行业的研究热点。目标检测是智能驾驶汽车环境感知的关键技术,对前方交通目标的准确检测有助于做出正确的驾驶决策。基于机器学习的视频图像目标检测是智能驾驶汽车环境感知的主要手段之一。相比传统机器学习检测算法,以SSD(Single Shot MultiBox Detector)为代表的深度学习检测算法在图像特征提取和运行速度上有明显优势,可以获得更好的检测效果,但检测精度尚无法完全满足驾驶场景的需要。因此,研究基于改进SSD网络的目标检测方法以提高其检测精度,具有重要的理论和实际意义。论文在深入分析SSD网络特点的基础上,针对检测网络架构的不足,采用深度残差模块和多层特征融合结构加以改进,针对训练时样本不均衡问题,采用损失函数中引入带参数的调制项的方法加以解决。论文的主要工作和贡献如下:(1)论文首先分析SSD检测算法的基本原理,然后依据驾驶场景下的检测任务,有针对性地选择合适的特征提取骨干网络,并基于统计数据调整了SSD算法中的先验框(Prior Box)机制,然后调整多任务损失函数,初步搭建了检测网络的框架。(2)针对SSD模型训练过程出现的样本不均衡问题,论文基于困难样本挖掘(Hard Example Mining)原理,引入带参数的调制项,对原有交叉熵损失函数进行了改进设计,然后对损失层的前向和后向传播过程进行了推导证明。该方法可使改进后的损失函数在训练时自动增大困难样本的损失值权重,从而使模型训练更加充分,模型收敛速度得以加快。(3)SSD网络使用多层特征图(Feature Maps)进行目标预测,其中较浅的特征层需要同时获取低级特征和高级语义特征,增大了网络模型训练学习的难度,不利于检测精度的提升。针对该问题,论文提出基于深度残差结构的预测补充模块,该方法能够将预测层和特征层进行结构上的分离,从而使多个待检测层的特征信息更加抽象,对于模型检测精度的提升有一定帮助。(4)由于低层特征图的语义信息相对不足,导致SSD网络对小目标的检测效果较差。针对该问题,论文提出基于特征金字塔的多层特征融合结构,将高层特征图以反卷积的形式进行上采样,然后连接到低层特征图中。该方法能够有效增强低层特征图的语义信息,从而提升整个网络特征提取的质量,进而可提升检测精度。综合上述改进成果,形成一个完整的基于改进SSD的目标检测网络。论文使用KITTI数据集对改进的网络模型进行训练和测试,然后进行了多项对比实验。实验结果表明,上述各项改进可以不同程度提升网络的检测精度。同时,该网络的检测效果也优于目前较为先进的Faster R-CNN和DSSD网络,而且检测速度也能达到实时水平,可以满足实际的应用需求。