论文部分内容阅读
视频目标跟踪是计算机视觉领域中的一项重要研究任务,由于其在智能视频监控、人机交互、智能交通等领域的巨大应用前景,近年来引起国内外研究机构和企业的广泛关注,具有很大的发展前景。本文首先介绍了视频目标跟踪技术的研究背景和研究意义,然后对该领域当前的国内外研究现状进行叙述,总结概括了视频目标跟踪领域的经典算法和关键技术,并对该领域的焦点问题和难点问题进行了阐述。通过对各种优秀的跟踪算法的研究与分析,本文提出一种全新的超像素跟踪算法,充分利用以往的跟踪算法中较少使用的中层视觉特征,构建目标的时空上下文模型,从而获得更精准的跟踪效果。最后通过大量的实验证明,本文所提出的算法能同时解决视觉跟踪领域所面临的遮挡、光照变化等多种问题,比以往的经典算法更具有适应性和有效性。对视频目标跟踪技术的研究已经经历了几十年,也产生了一系列跟踪方法,虽然已经有很多优秀的算法在解决某一种或两种问题时能产生很好的效果,但是,现实中的视频往往同时涉及多种影响因素,包括光照强度变化,完全遮挡和半遮档,目标自身的尺度变化,非刚性物体的形变,姿势变化,相似背景或物体的干扰和杂乱的环境等。目前还没有任何一个算法能同时解决上述所有问题,这在目标跟踪领域仍然是一个巨大的挑战。解决这一难题的关键,就是如何建立和维护一个十分有效的目标外观模型,使其能够同时适应各种因素引起的目标外观的诸多变化。以前绝大部分的跟踪算法或是直接利用低层视觉特征(如图像的灰度值)来构建目标模板,或是使用高层视觉特征(如Haar-Like特征)构建目标的外观模型。本文则是在中层视觉特征层面上,建立目标的超像素级时空上下文模型,充分利用超像素具有感知意义,能减少噪音并保持信息的近完备性的优势,提高模型的适应性和鲁棒性。最终目标位置的确定问题则看作一个求解目标出现在某一位置的概率的置信图问题,目标出现概率最大的位置即为所求的新一帧中的目标位置。最后,在视频目标跟踪领域的五个标准视频库上,应用本文提出的算法进行了实验,并与三个优秀的跟踪算法进行对比,分别从定性和定量两个方面对本文提出的算法进行了详细的分析与评价。