基于注意力对抗网络的目标跟踪方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:dizenxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉跟踪是计算机视觉中的一个热门研究课题,近年来其研究成果已经在各类生产环境中投入使用。摄像机使用的自动跟踪对焦、无人机用到的自动跟踪技术、基于步态的人体识别、机器人视觉导航系统、医学诊断中超声波的自动分析以及核磁序列图像等各领域都需要目标跟踪技术。目标跟踪的主要任务,简而言之,就是在连续的视频序列中建立被跟踪对象的空间位置关系,从而描绘出被跟踪对象的完整运动状态。给定被跟踪对象在视频序列第一帧中的坐标位置和大小,该对象在视频序列下一帧中的准确位置将被计算出来。根据某一帧中的目标对象位置信息,下一帧中目标对象所处的准确位置就被计算出来,如此周而复始,该对象的完整运动轨迹就被描绘出来了。被跟踪对象在运动过程中,可能会出现一些外观变化,例如姿态变化,尺度变化,以及由背景遮挡或光线亮度变化等其他条件引起的外观变化。很多目标跟踪算法的研究都在致力于解决此类问题。本文主要工作如下:(1)现有的基于深度学习的目标跟踪方法在在线更新阶段,会由于正样本的样本量不足而导致性能下降。VITAL方法提出了一种典型的网络结构,它采用生成对抗网络的思想,通过在特征空间生成mask的方式来丰富正样本。尽管这种结构取得了良好的效果,但这种丰富正样本的方式忽略了当被跟踪对象与周围对象非常相似时所发生的相似物漂移问题。特别是存在背景干扰并且同时出现与被跟踪的目标类似的其他对象时,此问题表现得尤为明显。为了解决这个问题,受DAT方法的启发,本文提出了一种新颖的将注意力机制与生成对抗网络思想融合的网络结构,它直接训练一个自带注意力的跟踪器,随着在线更新过程的进行,网络逐渐关注在目标对象中每一个可以将其与背景区分开来的区域。(2)受VITAL算法的启发,本文提出了另一种在特征空间中增强正样本的新思路,我们根据卷积层生成的特征图,利用生成对抗网络的思想,对正样本的通道特征进行选择,以此对正样本施加干扰,达到在特征空间中增强正样本的目的。同时,本文也在该模型中加入了防止出现相似对象之间漂移问题的注意力机制。在大多数深度学习的任务中,正负样本不平衡问题普遍存在,可以使用基于数据的方法和基于算法的方法解决这个问题。基于数据的方法可以通过数据类别均衡采样、扩大数据集等方法缓解这个问题。而在本文中,利用了在损失函数中加入正则项的方式解决这个问题。本文在模型中引入了一个交叉熵损失函数的变体作为模型训练过程中使用的损失函数,这种损失函数能有效控制类别不平衡问题。同时,本文还使用了一个称为AdaBound的新颖的优化算法来训练模型,它和SGD算法一样有效同时又和Adam算法一样快速,这在一定程度上加快了模型训练的速度。我们在(1)(2)的模型中均采用了这里提到的方法。通过以上工作,本文通过基于注意力对抗网络的目标跟踪方法的研究,提出了两个新颖的目标跟踪算法模型,实验证明,这两个算法在OTB 2013、OTB 2015以及VOT 2016这三个公共数据集上均达到了良好的性能。
其他文献
习近平总书记在党的十九大报告关于推动中华优秀传统文化创造性转化、创新性发展的重要论述,表明了文化建设的重要作用。中国传统文化的根在乡村,乡村蕴含着丰富的文化资源,尤其传统村落是中华优秀传统文化的承载者。近年来,中国快速的城市化进程使得很多的传统村落逐渐消失,同时也使得具有丰富的自然和人文遗产的传统村落备受青睐,乡村旅游蔚然成风。旅游经济型传统村落正是以古老的乡村文化为特色发展旅游经济的传统村落。乡
学位
基于强度传输方程的层析重建作为典型的非干涉三维重建方法,已经成为目前大量研究的热点。而在相位的层析重建中,通常需要获得多个方向的相位信息。虽然来自光场角矩成像的技术能够给出一个有透视效果的重建光场,但其并不能直接得到相位信息,并且不能直接得到物体的三维形状。另一方面,通过强度传输方程求解相位信息需要轴向强度微分,通常强度微分的获取是通过两幅强度之间的有限差分得到的,其精度不能得到保证。因此,如何提
在过去的十年里,随着世界人口的增长和人民生活水平的不断提升,节假日期间的人口大规模流动现象越来越普遍,社会公共安全、城市交通监管和城市规划等领域面临着巨大的挑战。拥挤和踩踏等安全事故经常发生在人群密集的场所。因此,越来越多的科研人员致力于人群计数与密度估计研究。深度学习的兴起,极大的推动了计算机视觉任务研究的发展。在人群计数与密度估计问题上,基于卷积神经网络的人群计数方案可以很好的应对许多诸如人群
近年来,绿帘石逐渐被作为小众宝石所收藏,但对其的研究还比较局限。本文通过基础宝石学测试方法和紫外-可见-近红外光谱、红外光谱、拉曼光谱、扫描电镜、电子探针及差热分析等现代测试手段,对巴基斯坦绿帘石的宝石学特征及颜色成因进行了分析研究。巴基斯坦绿帘石晶体颗粒小,自形程度高,多呈长、短板柱状,强玻璃光泽,半透明,折射率为1.7141.745,双折率为0.014~0.022(负光性),相对密度3.363
随着我国医疗事业的发展,各医院大型医疗设备安装数量不断增加。而医疗设备的安装,是整个医疗设备生命周期中的起点,是设备正常运行的先决条件。本文通过对C公司进口大型医疗设备安装质量管理的研究,以提高C公司的设备安装质量管理水平,也希望研究结果能够对同行企业带来借鉴。本文的研究,秉承六西格玛质量管理理念,使用定义、测量、分析、改进、控制的方法,对C企业的安装质量管理流程进行了详细研究并提出了改进方案。在
本文首先分析了本论文的研究背景和意义,并介绍了数据拟合问题的研究进展和现状.不同的拟合模型适合不同的问题,有着多种多样的选择.曲线拟合作为数据分析的重要工具,在数学、物理、化学等方面起着举重若轻的作用.第二章首先给出了传统物理方法中应用的氢原子体系的含时薛定方程.并主要介绍了数据分析中经常被用到的最小二乘法的理论知识和高斯拟合、傅里叶拟合的理论基础.以及这些拟合方法效果的评判标准.第三章首先给出氢
十八大以来,创新驱动发展成为我国经济发展方式转变的国家战略。在“大众创新、万众创业”的号召下,我国高新技术企业规模发展迅速,成为我国经济发展中的重要发力点,高新技术企业在企业自主创新过程中不断提升市场创新的整体水平,是我国实现自主创新最重要的载体。但是,与发达国家相比,我国高新技术企业起步较晚,发展尚不成熟,加之我国促进高新技术企业发展的税收法规和政策的不完善,对高新技术企业的自主创新促进作用不足
随着现代社会经济与科技的发展,日常生活与工作中产生了越来越多的信息,而其中图像占据很大比例,如何有效的处理、分析和理解图像显得至关重要。图像识别作为计算机视觉领域的研究热点之一,具有十分重要的理论意义与实际应用价值。传统的图像识别方法需要经验丰富的研究者人工选取图像特征,然后通过统计学分类器进行分类,往往识别准确率不高。在当前各种技术飞速发展的时代,传统方法的识别准确率和识别速率已经无法满足实际应
量子点链材料具有将电子限制在一维空间内的特性并且具备类量子线的特征,这使得量子点链相对于其他材料来说具有许多优势。本论文工作是对InGaAs量子点链材料在形貌、光电性质、发光特征及应力等方面的各向异性进行研究。我们主要通过系统的研究方法和实验方法理解不同生长参数对量子点链的生长过程以及各向异性特性的影响。主要研究内容和研究结果如下:(1)研究了不同生长温度下得到的InGaAs/GaAs量子点链材料
随着社交媒体深入发展,对人们的生活有着重要的影响作用,已经成为人们生活中的一部分。社交媒体为人们带来便利的同时,它的弊端也逐渐显露出来,其中问题性使用就是一个重要方面。这种使用行为给人们的生活带来了很多困扰,例如,人们在工作时使用社交媒体进行娱乐放松,可能会导致工作效率的降低。因此降低问题性使用行为成为一个值得被关注的重点。目前,在相关文献中,学者都简单地用自我控制来解释降低问题性使用的问题。可是