论文部分内容阅读
2016年以来,国家新型智慧城市迅速发展,为了顺应智慧城市的发展,未来的城市监控将会变得智能化、高清化,为此,需要使用计算机视觉的相关技术来解决当前非智能摄像头存在的一些问题,如无法实时预警、需要耗费大量人力物力进行分析等。作为计算机视觉领域的关键问题,单目标跟踪算法可以绘制给定物体的轨迹信息,方便后续进行行为分析和异常检测。因此,单目标跟踪问题作为计算机视觉领域的基础问题,具有重要的理论意义和研究价值。在城市监控场景中,监控画面非常复杂,主要体现在:(1)物体种类繁多,人流密度较大,不同的物体之间会发生频繁的遮挡;(2)物体在监控视频中运动时,会发生形变以及尺寸变化。这些问题给单目标跟踪算法带来了诸多挑战:(1)复杂背景中与目标相似的物体会干扰算法的准确性;(2)对外观渐变的物体进行跟踪时没有充分利用视频中丰富的时域信息。本论文针对上述挑战,开展技术研究。主要研究工作和创新点如下:1.提出了一种基于特征融合的单目标跟踪算法,用来解决复杂背景下如何减少相似背景对单目标跟踪造成的干扰问题。本文利用卷积神经网络提取特征的层次性,对深度特征进行融合,从而在保持深度特征判别能力的同时,提高深度特征的分辨率。为了解决目标被遮挡后无法继续跟踪的问题,本文将局部检测模型和全局检测模型结合结合起来,局部检测模型在目标周围进行精确定位,并计算物体的大小,一旦物体被遮挡或者跟踪失败,则利用全局检测模型对整张图片进行检测,如果发现目标出现,则继续利用局部检测模型进行跟踪。实验结果表明,与现有算法相比,本文提出的算法可以在公开数据集上提升单目标跟踪的性能。2.提出了一种基于帧间信息的单目标跟踪算法,用来解决复杂背景下如何充分利用时域信息的问题。本文从两方面来充分利用视觉信息,首先在采样阶段加入光流信息,根据上一帧计算得到的物体位置来预测当前帧物体可能出现的位置,并以此为基准点,进行采样,这样可以提高采样的质量。此外,本文将已经跟踪成功的目标作为一个样例,来给当前帧提供参考,本文使用孪生网络计算当前帧的样本和已经跟踪成功的样本之间的相似度,从而选出最为相似的样本,得到最终的跟踪结果。实验结果表明,与现有算法相比,本文提出的算法在充分利用了视频中的时域信息,使跟踪算法变得更加鲁棒。本论文在国家自然基金面上项目《用于交通管理的复杂拥挤环境下协同视频监控理论和方法研究》(编号:61371192)的资助下,研究复杂背景下基于深度学习的单目标跟踪算法,在一定程度上解决了复杂背景下如何减少相似背景造成的干扰以及如何充分利用时域信息的问题,提高了单目标跟踪算法的性能和鲁棒性。