论文部分内容阅读
行人检测技术是智能辅助驾驶系统中的关键技术,一直以来也是计算机视觉领域的研究热点之一,能有效减少交通事故的发生,提高驾驶的安全性,对保障人民群众的生命财产安全具有重大意义。但是由于交通场景中的行人目标存在姿态多变、行人所处的背景环境复杂以及行人目标较小等情况,使得目前的行人检测算法在实际应用中存在检测精度不高、检测速度较慢的问题。因此针对道路交通场景下的行人检测任务,考虑精确度和实时性检测的需要,论文基于SSD算法对交通场景行人目标的检测进行了研究。本文主要工作如下:首先介绍了目前主流的YOLO目标检测算法的工作原理及实现流程,通过对交通场景中行人的检测,分析实验数据可知该算法检测速度较快,但对尺度变化较大的物体泛化能力较差,当图像中有过于密集的目标时,容易发生误检、漏检的情况。其次,为了解决上述问题,本文主要研究了与YOLO算法同样满足实时性要求的SSD算法,该算法达到了和两阶段方法相当的精度,同时又保持了较快的运行速度。但是传统的SSD算法对于交通场景中小尺度行人目标的检测能力仍然不够理想,基于此,对SSD算法在网络结构上做出了以下改进:(1)卷积层结合稀疏连接。通过将主干网络的卷积层结合Inception模块中的稀疏连接,优化卷积结构,增加特征图中小目标的语义信息,从而增强网络的特征提取能力。(2)检测模块采用残差结构。当SSD网络提取出多尺度特征图之后,利用残差结构组成的检测模块代替传统的3×3大小的卷积核,来进一步提取特征图的深层特征,提高对小的行人目标的检测精度。(3)引入Focal Loss函数。引入Focal Loss函数设计新的损失函数,通过调制因子调整样本的权重,解决训练过程中正负样本不平衡的问题,使得网络更加关注于包含更多有用信息的困难负样本,从而加快网络的收敛,训练过程更加稳定。最后,分别将YOLOv2、YOLOv3、SSD以及改进的SSD共四种目标检测算法在公开的Caltech行人数据集上进行训练和测试,评估几种算法针对道路交通场景中行人检测的性能。实验结果表明,基于改进的SSD算法对于小尺度的行人目标在检测精度和速度上都有所提高,从而在一定程度上提高了对交通场景下行人检测的精度并保证了检测的实时性。因此,本文基于SSD算法对道路交通场景行人检测的研究具有重要的理论意义和广泛的应用价值。