论文部分内容阅读
基于单视觉(单摄像头)的多目标跟踪是计算机视觉和视频处理研究领域的一项基础研究并且正变得越来越重要。如果将目标特定为行人,那么单视觉多目标跟踪问题就转化为单视觉行人跟踪问题。它可以用在很多实际应用中,包括视频监控,自动辅助驾驶和智能机器人等。但是单视觉行人跟踪非常具有挑战性。相对于单目标跟踪,多目标跟踪中可以有很多需要跟踪的目标同时出现并且场景更加复杂。另外,不像基于3D信息的行人跟踪(通常需要多个摄像头的协作),目标被遮挡的情况在单视觉跟踪中几乎是不可避免的。大多数多目标跟踪方法使用基于检测的跟踪的框架。在这种框架下,借助于目标检测的帮助,跟踪器可以自动地处理某一类目标进入场景以及从场景中出去。多目标跟踪方法大概可以分为两类:一种基于局部的策略,这种方法一帧一帧地来跟踪一个目标。另外一种基于全局的策略,这种方法在用全局最优的算法在一个时间窗中同时找到所有目标的运动路径。网络流模型是全局策略中一个流行的基于图论的模型。在这个模型中,全局的数据(目标)连接问题被映射到一个网络流模型中并且使用一个优化算法来获得最优解。为了使跟踪器能够适应复杂的场景,使跟踪结果更加准确,在本文中目标检测结果之间的相似度评价函数被重新进行了定义。本文分析了一个用来减少优化的计算复杂度的基于贪婪算法的优化算法,以及它在我们的模型中不再适用的原因,并提出一种改进的贪婪的优化算法使其不仅快速而且准确。另外,本文构造了一种新的基于粒子滤波的网络流模型。这个方法结合了局部策略和全局策略,有效地克服了基于检测的跟踪中存在的问题。这个跟踪方法可以分为两个阶段:局部阶段和全局阶段。在局部阶段,完全离散的检测结果被连成一段一段可靠的tracklets.在全局阶段,用网络流模型来表示tracklets间的数据连接问题并转为求解最小代价流的问题。最后用一种两步优化的算法来处理长时间遮挡的问题。