论文部分内容阅读
视频目标检测与跟踪是计算机视觉的核心技术之一,是基于视频场景分析、行为理解和描述等诸多后续处理的基础。视频目标跟踪技术在智能视频监控、交通、人机交互、机器人视觉导航、虚拟现实、医学图像和国防等各方面都有着广泛的应用。视觉目标跟踪的研究目的是模拟人类视觉运动感知功能,赋予机器辨识视频序列图像中运动目标的能力,为视频分析和目标行为理解提供重要的数据依据。由于背景环境的复杂性、不同的光照条件、目标复杂的形状和运动方式、目标之间的相互遮挡和干扰等原因,视频目标跟踪目前仍然是计算机视觉应用中最具挑战性的任务之一。论文针对视频跟踪方法中的目标检测、目标跟踪和目标识别等主要模块进行了探索和研究,主要涉及的研究内容包括:(1)提出了基于区间分布模型的背景抽取方法,利用适当的背景更新机制,使得环境多变的户外监控系统中的目标检测与跟踪鲁棒性更强,同时也较好地消除了光照强度变化、系统扰动等原因带来的问题等;(2)针对传统的卡尔曼滤波在复杂场景下无法有效跟踪到运动目标,而应用其它鲁棒性能高的算法因其计算复杂度而不能保证系统的实时性,为了兼顾算法的复杂程度低和跟踪的鲁棒性高,利用线性子空间映射将非线性跟踪问题映射到逐段线性子空间,然后利用卡尔曼滤波实现跟踪,可以获得良好的效果;(3)考虑到跟踪算法在处理复杂场景的时候通常容易跟踪失败,提出了一种通用的跟踪方法利用上下文知识来辅助目标跟踪。上下文知识的表示方法和推理决策手段是通用的,可以方便地在不同场景下被采用,利用对场景内上下文的设定以及跟踪过程中跟踪模块与上下文的动态交互,可以有效地处理复杂环境下目标被遮挡、目标之间交互等带来的问题;(4)根据所陈述理论利用VC++.NET和OpenCv库实现了通用跟踪系统实验平台,结合上下文信息和推理决策,并且在不同场景下进行实验证明了提出的跟踪方法的合理性。