论文部分内容阅读
视频序列中的目标跟踪是机器视觉研究领域的一个重要课题,已经被广泛应用于各个领域。但是,由于场景的复杂性和目标运动的不确定性等因素的影响,实现准确地目标跟踪还面临着巨大的挑战。当物体在跟踪过程中出现平面旋转导致形变时,大多数的跟踪算法难以准确跟踪目标,产生跟踪漂移的现象。特别是当物体在运动的同时出现平面旋转时,跟踪算法无法跟踪到视频中的目标。本文针对视频中出现平面旋转导致目标形变的情况进行研究,具体研究内容如下:TLD(tracking-learning-detection)算法中的P-N学习机制能够根据跟踪模块和检测模块的结果进行学习,并将修正后的正负样本反作用于跟踪模块和检测模块,P-N学习机制对跟踪结果产生很好的修正作用。因此,本文详细研究TLD算法各模块的实现机制,并将TLD算法的整体结构和P-N学习机制作为本文算法的基础结构。仿射变换能够根据变换的自由度参数旋转变换坐标系的位置或目标的边界框,因此,在跟踪模块引入仿射变换。当跟踪过程中出现平面旋转导致目标发生形变时,利用仿射变换实现准确地目标跟踪。稀疏原型由PCA基向量和琐碎模板组成,能够很好的应对目标出现遮挡的情况。因此,为了解决平面旋转问题并使算法具备较好的适用性,基于TLD算法的思想提出了带有仿射变换的稀疏原型目标跟踪算法SP-TLD(sparse prototype-TLD)。在目标跟踪过程中,一帧图像会产生大量的扫描子窗口,其中很多子窗口中没有目标。因此,为了减少不必要子窗口的输入,在检测模块引入Kalman滤波算法。为了解决跟踪过程中出现平面旋转的问题,提出带有自适应判定因子的Kalman滤波,通过自动调节Kalman滤波参数,实现最优估计。在检测之前,采用Kalman滤波预测目标可能存在的大致区域,然后只将与该区域有交集的子窗口输入到检测模块。大量减少了输入的子窗口数量,极大的提高了检测效率,基于TLD算法的思想提出了SPK-TLD(sparse prototype-Kalman TLD)目标跟踪算法。通过实验将SPK-TLD算法与目前应对平面旋转情况较好的IVT算法和原TLD算法对比分析可知,SPK-TLD算法在出现平面旋转的情况下能够更准确地跟踪目标,具有更好的适用性、鲁棒性和高效性。