论文部分内容阅读
近年来,随着高像素成像设备和计算机处理数据能力的高速发展,计算机视觉领域得到了突飞猛进的发展。基于视觉的目标跟踪技术的研究是计算机视觉的一大重要方向。目标跟踪在智能监控、人机交互、医疗诊断等方面都有着广泛的应用。在跟踪过程中,常常面临着光照的变化、目标的形变、目标的遮挡等难题,虽然已经经过了数十年的研究,但目标跟踪仍是一个非常有挑战性的问题。现阶段,设计一个可以在任意场景下对任意指定目标进行跟踪的实时跟踪算法是跟踪领域的热点。特征提取是目标跟踪中最为重要的环节之一,目标的表观特征直接影响着跟踪算法准确率。卷积神经网络从2012年开始,已经在计算机视觉的很多领域展现出优异的性能,其强大的表观能力备受研究人员的青睐。本文首先在AlexNet网络结构上进行分类实验,并通过可视化操作分析不同卷积层提取到的特征的特点。随着卷积层的增加,网络提取到的特征越来越抽象,目标的局部特征丢失愈发严重,这种特征有助于目标的分类。不同于分类问题,目标跟踪问题则需要保留较多的局部信息,如位置信息等。通过可视化分析加深了对网络的理解,有利于跟踪算法中网络的设计。然后针对现如今基于深度学习的跟踪算法在线更新不满足实时性需求的缺点,结合卷积层提取特征的特点,本文提出了一种基于卷积神经网络的离线跟踪网络与基于粒子滤波的跟踪算法相结合的实时跟踪方法。通过对双通道卷积神经网络进行离线训练,学习相邻两帧之间的差异,得到跟踪目标的表观特征与运动之间的普遍规律。在不需要对网络模型在线更新的情况下,直接通过网络回归得到对目标的位置和对应置信度的预测,该离线跟踪网络的设计用于保证跟踪算法的实时性。同时,对于跟踪过程中出现的遮挡,快速移动等情况,通过与基于粒子滤波的跟踪算法相融合,保证其鲁棒性。本文提出的算法在VOT2014数据集上进行实验,实验结果表明该跟踪算法在有不错的准确性时,也保证了实时性,其运行速度可以达到40FPS,展现出较好的跟踪能力。