论文部分内容阅读
随着深度学习的复兴,人工智能技术开启了新的征程。自动驾驶技术作为人工智能技术的一个重要研究方向,是计算机视觉技术与传统工业相结合的产物。自动驾驶技术深入地渗透了人们的日常生活,能够带来巨大的商业价值,是学术界和工业界共同的研究热点,如今各大互联网公司及汽车制造商纷纷投身自动驾驶技术的研究。行人目标跟踪作为自动驾驶技术中不可或缺的一个环节,对提高自动驾驶的安全性有着重要作用和意义。相比于通用目标检测与跟踪,自动驾驶场景下的行人目标占画面比例更小,背景环境和运动姿态更多样,位置变化更快,且实时性要求更高,通用目标检测与跟踪算法较难满足自动驾驶场景下的行人目标跟踪任务。因此,本文从行人目标检测与行人目标跟踪两个方向进行研究,设计了一套适用于自动驾驶场景的行人目标跟踪算法。对于行人目标检测问题,本文设计了一个特殊的轻量级行人目标检测模型。该模型使用了本文提出的多尺度下采样模块,以减少行人目标信息在下采样过程中的丢失,并在下采样结束之后加入了空间金字塔池化模块,进一步丰富行人目标的特征,提升行人小目标的检测性能。经过实验,在BDD 100k和City Person综合数据集上,本文设计的轻量级行人检测模型的行人目标mAP能够达到64%,且GeForce GTX 2080Ti GPU上的运算速度高达7毫秒/帧,模型大小只有6 MB,运算量低至4.47 BFLOPs,能够满足自动驾驶场景的需求。对于行人目标跟踪问题,本文设计了一个基于卷积关联网络的行人目标跟踪模型。该模型摒弃了传统人工定义目标关联性的算法,使用卷积神经网络来学习与跟踪任务相关的目标关联性,并设计了一套跟踪策略来处理检测到的目标与已存在的轨迹之间的关系,实现跟踪任务。与经典判别式跟踪模型需额外提取目标的表观特征相比,本文设计的行人目标跟踪模型与轻量级行人目标检测模型共享目标的表观特征,减少了特征冗余计算,使得整个检测跟踪过程能够满足自动驾驶场景的实时性需求。此外,考虑到自动驾驶场景下行人目标表观相似性较大,位置变化剧烈,但目标之间相对位置关系变化较小,本文在卷积关联网络上加入了目标空间关系约束,进一步提高行人目标跟踪的效果。本文设计的行人目标检测跟踪算法,在速度和精度上能满足自动驾驶场景下行人目标跟踪的需求,并能给相关研究提供一定的思路。