论文部分内容阅读
智能监控系统作为建设智慧城市中不可或缺的部分,在人类平时生活中也逐渐得到越来越广泛的应用。在建立智能监控系统的过程中,最为关键的是如何有效的应用智能视频分析技术,而运动目标跟踪技术则是智能视频分析技术中的一项重要的基础技术。因此,研究运动目标跟踪技术不仅能够有效的促进智能视频分析技术的发展,更能促进人类社会中的智慧城市的建设。近年来,得益于包括传统机器学习和深度学习在内的各项技术的发展,使得运动目标跟踪技术发展迅速,并且出现了很多表现优异的算法。目前这些算法大体上可分为两类,一类是基于传统机器学习方法,另一类是基于深度学习方法。这两类方法各有千秋,且均有其适用的场合。基于传统机器学习的目标跟踪方法不需要大量的数据训练分类器,而且大部分方法的速度具有优势,缺点是所提取出的手工特征在某些挑战下不够鲁棒。基于深度学习的目标跟踪方法优点是可以提取出目标中更为丰富的特征,但是需要大量的数据进行模型训练。但是,这些目标跟踪算法大多偏向于如何去设计一个鲁棒的外观模型和构建有效的跟踪框架,并且在一定程度上满足了智能监控系统中的目标跟踪需求。但是在目标跟踪过程中出现的各种挑战往往能够直接影响着跟踪的最终表现,比如,背景嘈杂和目标被遮挡对目标跟踪有极大的影响,等等。本文针对上述目标跟踪中存在的问题展开了相关研究,主要的工作和贡献包括如下两点:(1)针对如何减少嘈杂的背景对目标跟踪的影响,提出了一种基于空间正则化图学习的目标跟踪算法。具体来说,首先对目标跟踪框进行划分成多个不重叠的图像块且为每个图像块分配一定的权重,以表示其属于背景和前景目标的重要性。并利用图像块作为结点来构图,构造的图可以自动根据图像块之间的全局和局部结构关系在线学习图像块与块之间的内在联系。并且优化过的图结点权重与图像块的特征一起构建最终的目标特征表示,以此减少目标框中背景的影响。最后将优化后的权重结合到结构化SVM中来得到最终的目标位置。在多个公共数据集上进行了对比实验,验证了该算法的鲁棒性和有效性。(2)针对单模态目标跟踪中目标时常由于环境恶劣,如低光照、低分辨率等,而造成目标丢失,由此,提出一种基于双流卷积神经网络的多模态目标跟踪算法。具体而言,首先利用通用卷积神经网络模型来分别提取可见光下的目标和红外光下目标的特征,并设计了一个融合网络来融合两个模态的特征图并选择其中具有判别性的特征图,以此来去除多余的噪声影响和减少后续计算的冗余性。最后与多通道相关性滤波相结合,从而提高跟踪时的速度和鲁棒性。通过在公共数据集上与现有的方法进行对比实验,从而验证了算法的有效性和鲁棒性。