论文部分内容阅读
视觉目标跟踪(Visual Object Tracking)是计算机视觉的广泛应用中最重要的、最具有挑战性的工作之一,它要处理的问题是在视频序列中得到目标的尺寸、位置等参数,在自动驾驶、智能交通、人机交互以及机器人视觉导航等领域具有重要的应用。随着计算机软硬件的发展,深度学习(Deep Learning)技术开始在计算机视觉领域取得广泛应用,基于深度学习的目标跟踪算法是未来的研究趋势。本文算法针对基于人工特征的背景感知相关滤波算法(CACF)在诸如超出视野、运动模糊、光照变化等复杂环境下跟踪效果差,提出卷积回归网络视觉目标跟踪算法,并在此基础上引入重检测机制,以解决模型预测不准确下错误积累导致跟踪失败问题,最后提出利用多个卷积层特征进行跟踪以达到提高算法精确度目的,本文主要工作如下:1)提出了一种卷积回归网络视觉目标跟踪算法(CRN),有效处理传统人工特征算法在光照变化、低分辨率等复杂环境下跟踪效果差的问题。传统相关滤波算法中滤波器的参数人工设定,本文将岭回归作为卷积神经网络中的一层,通过设计其反向传播参数,最终形成卷积回归网络,整个网络在数据集上进行端到端训练,卷积神经网络专为目标跟踪任务设计,特征表达能力更强。2)在卷积回归网络算法(CRN)的基础上,引入重检测机制。为解决严重遮挡等情况下算法漂移,建立一个重检测机制,在跟踪过程中通过响应值设置一个阈值,用于监督是否进行重检测,当响应值小于给定阈值时激活重检测,在重检测阶段通过训练一个支持向量机分类器来区分目标和背景,为避免陷入局部最优,重检测模型在检测时将扩大搜索范围。3)提出一个利用多个卷积层特征目标跟踪算法(MCT),卷积神经网络的深层特征是对目标的语义抽象,浅层则保留了更细粒度的空间细节,其中语义特征对显著的外观变化鲁棒,而空间细节对于精确定位十分有效的,因此提取不同的网络层特征将其融合后进行跟踪,同时针对目标尺度变化引入尺度自适应模型,通过一个一维得尺度滤波器,选取合适目标尺度,最后提出一个响应值峰值分布函数,通过建立一个噪声阈值来控制模型是否更新,确保不进行无意义更新。