论文部分内容阅读
对道路上的多种类目标进行感知、定位和识别,在智能交通、机器人研究、无人驾驶、视频监控等领域都具有较强的学术意义和工程意义。由于道路目标繁杂,多种类,不同数量的道路目标同时出现概率极高,同时由于目标的特征提取受天气,遮挡等因素的影响较大,因此对于道路上多目标的检测,分类及定位是一个具有多重挑战的综合问题。现有的深度学习目标识别框架主要分为两种,一种是以Faster R-CNN为代表的基于RPN(候选区域选择网络)的卷积网络框架,识别精度较高,但是识别速度很低。第二种是利用回归思想,以YOLO网络为代表的卷积网络框架,识别精度较低,但是处理速度很快。这两个目标检测算法基于国外公开数据集VOC,COCO等,对我国道路环境下的常见目标,存在识别不全、不准的情况。针对上述存在的问题,本文在FasterR-CNN和YOLO算法的区域选择思想和回归思想上,对其进行改进并构建针对道路多目标检测的深度卷积网络。首先本文对公开数据集VOC2007和VOC2012进行扩充,通过网络爬虫和拍摄的方式,对原有的道路目标进行增强,并新增了信号灯等道路目标类别。之后对流行深度学习框架进行简单测评,通过对比选择TensorFlow作为实验框架。使用增强后的数据集对改进后的GoogLeNet进行训练。改进方式为加入空间金字塔池化算法、使用深度分离卷积模块改进Inception模块和添加批规范化层。使得该网络可以以不同尺寸的图片作为输入,训练加速。该过程完成低层图像到高层语义之间的转换,进而对单张静态图片的特征进行提取。该改进提升了特征提取的精度和速度。之后以该网络为特征提取网络,构建基于区域选择的道路多目标检测网络和基于回归的道路多目标检测网络。基于区域选择的道路多目标检测网络为在Faster R-CNN的技术上,使用改进后的GoogLeNet,作为特征提取网络,并使用ROI池化完成检测。通过控制变量的实验,对Anchor选取策略、学习速率和批大小进行调整以获取最佳训练效果。经实验证明,该网络mAP提高了 2.5%,对VOC数据集的检测速度提高了:0.1s。对实际高像素真实图像的检测速度提高了约9s。基于回归的道路多目标检测网络为在YOLO的基础上,使用改进后的GoogLeNet,作为特征提取网络,通过K-means聚类算法选取最适合道路目标的候选框形状。对生成的特征向量进行回归拟合。通过实验完成对参数的调优,实验证明mAP提高了 1.9%,对实际高像素真实图像的检测速度提高了约0.3s。最后对使用深度卷积网络进行道路目标检测中的训练经验进行总结,并对两种网络模型进行对比分析。实验表明,二者均可以完成对道路交通中的主要目标,在现实环境下的检测。基于区域选择的道路多目标检测网络精度较高(60.3%),而速度较慢(3.7fps);基于回归的道路多目标检测网络精度较低(41.1%),而速度较快(34fps)。因此需要结合不同使用场景灵活应用。