尺度变化和遮挡同时存在情形下的视觉目标跟踪

来源 :东华大学 | 被引量 : 0次 | 上传用户:felixsilent
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪是计算机视觉领域中最具挑战性的任务之一,它在诸多领域都有着广泛的应用,如智能视频监控、人机交互、无人驾驶、虚拟现实、医学图像诊断等。尤其是近年来,随着无人驾驶技术的飞速发展,视觉目标跟踪更是受到了越来越多学者的关注。
  视觉目标跟踪的基本思想是跟踪一个在连续图片帧中的通用目标,同时目标的位置和边界框在第一帧时已经给定,视觉目标跟踪任务需要实现的是在剩余的图片帧中估计目标的位置和边界框。值得注意的是,由于尺度变化、遮挡、光照变化和旋转等因素造成的目标外观变化,现阶段尚未有一种视觉目标跟踪算法可以适应所有情形下的跟踪任务。其中,尺度变化和遮挡是视觉目标跟踪任务中最为常见的两种情形,因此在本文中,我们主要关注在目标尺度变化和遮挡同时存在情形下的视觉目标跟踪问题。
  在本文中,我们提出一个在尺度变化和遮挡同时存在情形下的视觉目标跟踪算法。首先,针对目标的初步定位问题,我们采用核相关滤波器来确定目标的初步位置。具体地,我们在前一帧的目标位置处采集大量的样本,并为每一个样本添加二维高斯标签,通过最小化带有L2约束的平方和损失来训练一个核相关滤波器。搜索窗口经过核相关滤波器进而得到相关响应,相关响应的最大值所对应的位置即为目标的最佳位置。同时,我们对样本特征进行改进,即采用预训练的卷积神经网络VGGNet-19来提取样本特征,具体地,采用其Conv1-2、Conv2-2、Conv3-4、Conv4-4 和 Conv5-4 层的参数来表示样本特征。为了得到更精确的结果,我们在每一层特征上都训练一个核相关滤波器,进而得到5层的相关响应,并将其线性叠加得到总响应,总响应的最大值所对应的位置即为当前帧目标的初步位置。其次,在解决目标尺度变化的问题上,我们在算法中融合尺度自适应机制。具体地,我们在目标位置附近采集不同尺度的样本,将其调整至相同尺寸后为每个样本添加一维高斯标签,同样是通过最小化带有L2约束的平方和损失来训练一个尺度滤波器。调整至相同尺寸的不同尺度的样本在经过尺度滤波器后会得到不同的尺度响应,尺度响应的最大值所对应的尺度即为当前帧的最佳尺度。随后,在解决目标遮挡的问题上,我们提出一种新的遮挡检测及处理方法,即先计算总响应的峰值旁瓣比,判断目标是否发生遮挡:若峰值旁瓣比大于给定阈值,则目标不发生遮挡;若峰值旁瓣比小于给定阈值,则目标发生遮挡。当目标发生遮挡时,用支持向量机分类器重新寻找目标,更新目标位置。
  我们在OTB-50数据集上进行大量的实验,并采用与其它跟踪算法相同的评估指标和评估方法。实验结果表明我们提出的视觉目标跟踪算法在精确度和成功率两个方面都优于其它的算法。更重要的是,在尺度变化和遮挡同时存在的情形下也可以成功的对目标完成跟踪,减少目标跟踪丢失和跟踪漂移。
其他文献
摘要:在变电站的实际工作中,分析运行维护风险属于其重要内容,旨在确保其安全稳定运行,所以,对变电站运行过程中遇到的风险因素要进行全面掌控,采取科学合理的维护措施,尽可能地将风险扼杀在萌芽状态。然而,实际工作中,变电站运行维护风险来源非常广泛,要进行多方面分析,才能避免风险发生。本文指出变电站运行维护中的风险因素,并提出合理的維护措施,以期能够为做好变电站运行维护工作提供帮助。关键词:变电运维;风险分析;控制措施中图分类号:F426 文献标识码:A引言当前,人们日常生活对电力系统的依赖性越来越大,要使电力系
期刊
下肢助力外骨骼机器人是一种可穿戴式设备,它的出现使得穿戴者增强在负重行走、托举搬运和边检巡逻的运动技能,其作用主要在穿戴者展现自身运动动作时,无阻碍增强穿戴者的耐力、提高穿戴者的负重能力、保护穿戴者运动肢体,进而,提高穿戴者的工作效率或战斗力。下肢助力外骨骼机器人可以在人体运动的同时有机融合人体的下肢和上身部分,这种可穿戴设备通常由两条拟人化机械腿、相应的支撑连接设备以及配套的软硬件设施等组成。本
随着不同分辨率的移动设备数量的快速增长,如何将视频适配于多样的移动设备成为一项重要的研究课题。视频缩放技术将视频分辨率缩放至目标分辨率或长宽比以适应不同的播放设备。传统的视频缩放方法,例如均匀缩放或裁剪视频内容,通常会造成视频失真或内容损失,从而效果较差。基于内容感知的视频缩放方法,在改变视频分辨率的同时,能够保持视频中关键对象的形状,并协调视频帧之间的时间一致性和空间一致性,从而产生更少的视频伪
相比于传统的PID(Proportional-integral-derivative, PID)控制方法,先进PID控制方法继承PID结构简单、易于实现和适应性强等优点的同时还具备先进控制策略的优良性能,近年来受到了学术界和工业界越来越多的关注。如何针对复杂控制系统设计先进PID控制器获得更优的控制性能具有重要的理论意义和工程应用价值,已成为控制领域的研究热点之一。一方面,进化算法为先进PID控制
学位
随着卷积神经网络(Convolutional Neural Network, CNN)的诞生与发展,图像分类精度得到了前所未有的提升。众所周知的是 CNN的灵感来源于生物学家 Hubel 和 Wiesel 提出的大脑视觉感知层级模型。本文借鉴该思路,希望通过大脑视觉认知机制启发来改进CNN,使得图像分类性能更好。由此展开了对脑机制与CNN结构特征改进的相关研究。  脑神经科学领域研究表明,人类大脑
学位
摘要:老旧设备的长期运行普遍满足不了日益增大的容量要求,特别是对于运行已久的10kV高压开关柜设备,其电流互感器变比和容量设计值较小,已无法满足目前居民用电的需求和现状运行的要求。为保证电力系统安全可靠运行,保障用户供电可靠性,需要更换变比大、容量大的电流互感器。但由于开关柜内部空间有限,并且零部件多,部件之间空隙非常狭小,电流互感器安装位置一般处于母排和电缆之间,检修人员根本无法进入柜内进行工作,且电流互感器重量重,外加空间狭小,容易发生掉落事件,造成人身和设备损伤,不仅消耗大量的时间和人力且工作效率较
期刊
在计算机科学与认知神经科学的浪潮推动下,算法与深度网络模型在越来越多的任务上接近甚至超越了常人,但仍有很多更大型实际的复杂问题亟待解决。相较于单体,多智能体系统作为具有多个独立执行个体的集群,具有个体结构简单、鲁棒性强、可塑性强等明显优点。其主要通过研究个体间的冲突消解、协调合作、资源抢占等方面,在兼顾个体优化的基础上聚焦如何有效地最大化整体能力。本文就此展开了相关研究,主要对系统内单体的决策优化
神经元是大脑神经系统的基本组成单元,大脑中每个神经元都要接收成千上万个树突信号输入。生物实验发现树突上不同位置的输入到达胞体时的膜电压不同,而一般的神经元模型都忽略了树突的形状,因此在点模型中考虑树突整合效应可以使模拟神经网络更接近真实的神经网络。神经元之间通过突触连接,神经学家们认为大脑的记忆功能是突触连接强度不断变化,即突触可塑性作用的结果,因此对突触可塑性的研究有利于探究生物学习与记忆的奥秘
作为图像数据中重要的信息之一,场景图像的分析是目前计算机视觉领域的研究热点。场景图像的分析主要包括了场景分类和场景检测任务,例如让机器能够像人一样理解场景图像所属于的类别,当前场景图像中所含有的物体,以及这些物体在当前场景中所处的位置。然而,由于现有方法的局限性,场景分类检测任务仍未得到完美的解决。因此,改进现有方法突破瓶颈成为场景分类检测领域中亟需解决的关键问题。  深度卷积神经网络是一种基于人
学位
摘要:随着我国科学技术水平的显著话提高,相关行业在实际发展过程中也开始运用各类先进化技术,这些技术措施的运用可以在一定程度上提升企业的生产效率,但同时也对企业内部管理工作提出了更高的要求。其中电力企业直接关系到社会大众的日常生活与工作,因此电力企业就需要对电力供应的稳定性和安全性予以重视,并在实际的运行过程中采取合理、有效的措施来保证电力系统的正常运行,保障电力企业的供电质量,进而维护社会的稳定、健康发展,推动电力企业的进一步发展。关键词:电力调控运行;重要性;优化管理措施随着经济的发展和市场需求的增加,
期刊