论文部分内容阅读
为了提高汽车驾驶的安全性与舒适性,越来越多的汽车生产厂家将目光聚焦于智能辅助驾驶系统的设计和开发。随着人工智能的发展,自动驾驶技术已经成为当前汽车行业的最新发展方向,而对外部环境的精准感知是实现自动驾驶的前提和基础,因此为了提高汽车的环境感知和避障能力,车内智能驾驶系统需要对周边目标进行实时测距、检测和尺度测量。当前自动驾驶汽车主要依靠激光雷达等传感设备来实现汽车周边的障碍物感知,但在汽车行驶路况良好的情况下,也可以利用车载摄像头等装置来实现纯视觉的目标检测及测距任务,基于视觉的方法具有更低的测量成本,且可以作为辅助方法来帮助汽车实现更好的环境感知。本文基于自动驾驶避障的应用需求,分别从目标测距、目标检测及获取目标尺寸这三方面展开研究,并基于这三种技术设计了一个针对“人”进行高度测定的双目立体视觉系统。基于双目相机的目标测距关键在于立体匹配算法的设计。本文对PSMNet立体匹配算法进行结构优化,首先使用通道注意力机制对该网络结构中的匹配代价卷进行改进,具体的,本文分别使用欧氏距离、余弦相似度、Pearson相关系数这三种不同的距离度量函数来计算左右特征图的相似度,并将该相似度值作为匹配代价卷深度维的注意力权重,本文对这三种改进方式下的网络输出结果进行实验比较,最终选择使用Pearson相关系数来计算注意力权重并对匹配代价卷结构进行改进。其次,为了进一步对PSMNet中的3D CNN进行改进,本文分别使用了Spital结构与Encode-Decode结构来代替原网络的Basic结构,经过实验对比,本文最终选择输出视差精度更高的Encode-Decode结构来构建3D CNN。本文在Yolov3算法的基础上来实现对“人”的目标检测算法设计。为了提高检测框的平均精度,本文对Yolov3的Anchor进行了重新设定,使其更符合“人”本身固有的尺度,同时引入了Io U置信度及soft-NMS对Yolov3后处理步骤进行优化。针对Yolov3存在的正负样本不平衡问题,本文重新设计了正负样本的划分规则。为了使网络适应对小尺度目标的检测,本文在Yolov3的FPN结构中引入空洞卷积来保留更多小尺度目标的高层语义信息。为了进一步提高目标检测的实时性,本文使用Mobile Net_v2对网络的主干结构进行优化。通过上述一系列的改进,优化后的目标检测算法相比于原Yolov3算法能够对“人”实现精度更高且速度更快的检测。为了进一步提升检测框的精度,首先,本文基于边缘图来寻找目标底部与地面之间的分界线,从而对检测框下边进行矫正,其次,本文基于视差图来寻找目标顶部与背景之间的分界线,从而对检测框上边进行矫正。经过实验对比可知,矫正后的检测框具有更高的精度和稳定性。基于上述立体匹配算法、目标检测算法和检测框矫正算法的设计方案,本文利用立体视觉中像素坐标系到相机坐标系的转换关系最终实现了对“人”这一类目标的高度测定。