基于动态锚点的目标跟踪网络

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:spendtime
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,很多优秀的单目标跟踪算法被研究者提出来,在主流的目标跟踪数据集上取得了长足的进步。然而,这些方法大都将注意力放在目标分类方面,目标尺度的评估却没有得到足够的重视。大多数目标跟踪网络对目标尺度评估的方式有以下几种:多尺度测试,预设固定尺度Region Proposal Network(RPN),反向迭代优化等方式。这些目标尺度评估方式没有考虑到相邻帧之间的潜在信息。为了更好的对目标尺度进行评估,本文主要工作内容和创新点可总结为以下三点:第一,为了在尺度评估部分充分考虑相邻帧之间的联系,本文提出了一种基于动态锚点的目标跟踪网络。不同于预设固定尺度的RPN的方式,本文利用上一帧的尺度作为当前帧锚点的初始化尺度,从而充分利用相邻帧之间的尺度信息,并预测新的尺度。第二,由于每个锚点没有固定的初始化框,因此网络无法学习到每个锚点对应的语义范围。为了解决这个问题本文提出了边界支撑模块。该模块将不同初始化框中的特征映射到对应的锚点上,使得网络能学习到每个锚点对应的语义范围,与动态锚点方案形成互补。第三,由于Discriminative Correlation Filter(DCF)的方式预测的目标中心是一个粗略的位置,因此为了更进一步提高定位精度,本文增加了一个离线的中心修正分支。在DCF预测的中心的基础上,进一步调整中心位置,得到更加精确的目标中心,进而提高目标跟踪的性能。为了验证上述所提到的方法的有效性,本文在主流的目标跟踪的5个数据集上对该算法进行评测。其中UAV123,La SOT,以及Tracking Net采用One Pass Evaluation(OPE)的方式对跟踪器进行评估。VOT2018,VOT2019采用Expected Average Overlap(EAO)的方式对跟踪器进行评估。实验证明在5个主流数据集上,本文方法可以有效提高目标跟踪的性能。其中在相邻尺度变化较为平滑的数据集La SOT上取得了最优的结果。另外为了证明动态锚点,边界支撑模块,中心修正分支在最终性能中的贡献,本文分别对不同模块进行充分的实验进行验证。
其他文献
“五项管理”指的是中小学生作业、睡眠、手机、读物、体质管理。教育部先后出台关于加强中小学生作业、睡眠、手机、读物、体质等“五项管理”文件。在推进“五项管理”落地见效的过程中,要切实发挥学校、家庭、社会的共同作用,统一思想,共同发力。这样就既能减轻学生过重的课业负担,又能促进中小学生健康成长,从而形成协同育人的新格局。
随着电商系统复杂度的提高,数据量的增大,亟需通过测试的方法帮助用户选择最适配的数据库产品以支撑系统高效地运行。现有的测试工具对面向电商应用、多样的事务场景、多种云数据库类型、生成大量负载并快速转发等需求的测试支撑能力不足,因此设计实现一个面向电商应用的云数据库性能测试工具是有重要意义的。通过对电商应用特点的分析,针对面向电商应用、多样的事务场景、多种云数据库类型的需求,从数据结构、数据操作、数据约
研究背景:骨癌痛(cancer-induced bone pain,CIBP)是一种机制复杂的慢性疼痛,不仅涉及炎性痛和神经病理性疼痛,还和酸中毒以及自身骨质破坏等病理机制有关。骨癌痛患者遭受着巨大折磨,但目前并无有效缓解疼痛的方法。近年来研究发现α7烟碱乙酰胆碱受体(nicotinic acetylcholine receptors,n ACh Rs)分布在与疼痛相关的信号通路中,并在多种疼痛模
绩效考核用于考核企业之间管理水平的高低,在企业中发挥着重要的作用,为企业提供标准化评价规范,同时为企业提供改进措施与管理方向。烟草行业作为我国的特殊行业,缺乏一定的市场活力,不同地级市的烟草商业公司还未能形成标准统一的绩效考核规范。目前国家不断重视烟草企业绩效管理,颁布了相关制度规范,但我国关于物流卷烟企业绩效评价的研究仍处于起步阶段,由于没有比较科学完善的考核制度,行业未能形成绩效考核标准。因此
烟草行业是我国税收的重要支撑,烟草在存储和加工过程中长期受到烟虫的侵害,造成了行业经济损失。目前对烟虫的监测主要依靠人工对烟虫诱捕器进行识别与计数,存在效率低和实时性差等弊端。研究具有烟虫自动识别和计数的机器视觉系统,对于提高类似的害虫监测和控制具有理论和实践意义。论文实现了三种烟虫检测方法并开展了比较研究。首先采用基于分水岭算法的传统图像识别方法,用分量法和Otsu阈值法对图像进行二值化,并用形
[db:内容简介]
脱口秀节目是一种以喜剧为根本的语言类的表演,重在语言应用,幽默的语言是脱口秀节目可持续发展的内生动力。基于Grice的合作原则,探讨幽默语言产生的机制,对近年来火爆的几档脱口秀节目的言语幽默进行深度探究,以期为脱口秀节目的可持续发展提供语言策略的支持,进而提升其吸引力和竞争力。
随着通信、计算机技术的发展,数字电视、视频会议等传统媒体产业爆炸式发展,这给数据存储和网络传输带来了巨大挑战。数字视频压缩编码在其中起到了巨大的作用。例如目前应用广泛的高效视频编码H.265/HEVC(High Efficiency Video Coding),还有最新发布的H.266/VVC(Versatile Video Coding)视频框架。同时,随着人工智能和5G时代的到来,人们生活方法
新型社会治理格局下,要实现社会的和谐发展,应该利用好政府公共关系这个平台,实现政府与社会组织和公众之间的良好互动。地方政府应重视公共关系的构建和发展,积极转变观念,加强与社会组织及公众之间的沟通交流,构建相互信任、相互支持的良好关系状态,以对话协商的方式促使各主体参与公共事务的管理并达成共识。
随着图像视觉技术的不断发展,传统相机在信息获取手段单一,以及不具备景深自动调节能力等问题难以满足人们对信息获取多样化的需求,而光场相机的发展在一定程度上满足了这一需求。基于传统相机的成像技术只记录了光信号的空间位置信息,为了获得准确的对焦面,拍摄时需要先调整镜头对焦再拍摄,而Lytro光场相机作为一种新型相机可以通过一次拍摄,同时获得光信号在空间中的位置信息和方向信息,多维信息的获取为光场相机先拍