论文部分内容阅读
目标跟踪是计算机视觉的一个重要分支,一直受到世界各地研究学者的关注。视频目标跟踪算法可以被广泛应用于各种现实场景,比如:虚拟现实、无人驾驶、智能交通和人机交互等。视频目标跟踪的任务是在一个视频序列的初始帧中给定一个指定的目标,并预测其在后续帧中的大小与位置。但是目标跟踪现阶段遇到了许多困难和挑战,比如光照变化、运动模糊、遮挡、旋转等。这些困难和挑战会影响目标跟踪算法跟踪的准确性,可能会导致跟踪目标出现漂移现象。因此,基于上述相关知识对目标跟踪继续深入研究。目标跟踪算法大致的研究方向分为两类,一类是传统方法,一类是基于深度学习的方法。传统的目标跟踪方法大多采用相关滤波,在第一帧给定的目标位置提取图像块,训练得到相关滤波器。随着深度学习在计算机视觉领域应用越来越广泛,由于深度学习的算法类似于人类大脑处理算法的过程,因为大脑和深度学习模型都涉及大量的计算单元。基于深度学习的目标跟踪算法逐渐发展,并在其中加入各种神经网络算法,可以较大幅度提升目标跟踪算法的鲁棒性并准确跟踪视频中的目标。本文针对深度学习训练过程中存在的三个问题(1)深度学习训练所花费时间多。(2)深度学习的参数具有不同的属性。(3)深度学习在训练过程中需要大量数据。提出并构建了一种基于证据推理的深度学习参数评估方法。该评估框架是分层结构,被分为三层,在其中加入证据推理算法,在每次修改参数前,将参数输入证据推理参数评估算法中,判断该组参数是否可以提高算法的鲁棒性,这样可以大大减少训练算法所浪费的时间。在第四章提出基于注意力机制和孪生网络的目标跟踪算法,在SiamFC算法的基础上进行改进,加入的卷积注意力模块将注意力分为两个维度,空间注意力和通道注意力。同时将两张图片输入网络中,比较其相似度,若相似度高,其得分就相对较高。将相似度得分高的位置作为下一帧预测的目标位置。该算法在SiamFC的基础上提升了0.6个百分点。