论文部分内容阅读
随着信息技术日新月益的发展,和人们出行需求的增加,如何将最先进的技术用在室外街景领域成为众多学者、企业所要解决的一个难题。近年来,深度学习技术发展迅猛,其直接促进了目标检测技术的突飞猛进,也使得将目标检测技术运用在室外街景领域成为可能。2D目标检测技术能够对相机采集到的图像中的常见目标进行类别和位置的检测,3D目标检测技术能够对图像、点云数据中的常见目标进行类别和空间位置的检测。因此它们能够用在对室外街景常见目标的检测中,例如交通标志、汽车、行人等,从而能够在交通管理、路径规划、自动驾驶等领域发挥作用。本文试图对目前最先进的室外街景目标检测技术予以改进和提升,从而推动其发展和实用化进程。本文主要内容如下:1.本文研究了一种基于多矩形框拟合和模型压缩的室外街景图像不规则目标检测方法。为了避免图像分割方法带来的巨大计算量,本文采用多矩形框拟合的方法,通过CNN网络生成多个较小的矩形框,合成为一个较大的多边形,来拟合不规则的目标轮廓,同时通过改进后的非极大值抑制方法减少了候选框之间重叠。为了满足室外街景快速处理的需求,本文采用了MobileNet-SSD深度学习模型,并且通过模型压缩进一步加快了处理速度。2.本文研究了一种基于尺寸聚类和边缘检测的室外街景图像3D目标检测方法。为了解决单目图像进行3D目标检测任务时所面对的信息缺失的问题,本文将目标的边缘信息进行了特征提取,将这些特征作为补充。同时,通过对尺寸分布的观察,本文发现同类目标尺寸在各个维度上方差分布并不均匀,因此本文提出采用多个候选尺寸来对目标的尺寸进行预测,以减少检测中尺寸回归的难度。3.本文研究了一种基于标签优化和点云实例分割的室外街景图像3D目标检测方法。本文提出了一种新的点云实例分割网络,其直接对点云数据进行操作,通过跳跃连接和可迭代网络的方式,优化了信息传递,提升了检测精度。与此同时,本文观察到KITTI数据集存在的标注不准确的问题,通过将标注的尺寸等比例放大,在不增加任何计算量的情况下,取得了精度的提升。为了验证本文算法的有效性,本文构建了室外街景目标检测数据库,实验结果表明本文算法对室外街景目标检测任务具有良好的解决性能。