【摘 要】
:
目标跟踪是计算机视觉领域一个重要的研究方向,它的目的是在给定视频第一帧目标框的情况下,能够在后续的视频帧中对该目标的具体位置进行准确、鲁棒地预测。这项研究在视频监控、无人驾驶、机器人、还有基于物联网的智能系统等方向有着广泛的应用,也是国家推行的“平安城市”、“智慧城市”的重要手段,有着很强的理论研究和现实意义。传统的目标跟踪技术需要手工制作目标模型或提取目标特征,然后在后续视频帧中进行相似性搜索,
论文部分内容阅读
目标跟踪是计算机视觉领域一个重要的研究方向,它的目的是在给定视频第一帧目标框的情况下,能够在后续的视频帧中对该目标的具体位置进行准确、鲁棒地预测。这项研究在视频监控、无人驾驶、机器人、还有基于物联网的智能系统等方向有着广泛的应用,也是国家推行的“平安城市”、“智慧城市”的重要手段,有着很强的理论研究和现实意义。传统的目标跟踪技术需要手工制作目标模型或提取目标特征,然后在后续视频帧中进行相似性搜索,逐渐迭代实现目标定位。但传统的目标跟踪技术需要手工设计特征,不仅费时费力,且准确度低,跟踪效果一般。得益于大数据及GPU的发展,基于深度学习的目标跟踪技术成为解决该问题的有效途径。该技术是利用卷积神经网络学习训练数据集中特定目标的特征,以期在场景中能够准确地跟踪到特定的物体。然而由于真实环境的复杂多样,目标会遇到诸如形态变化、尺度变化、遮挡与消失、图像模糊等影响跟踪的问题。如何设计出对被跟踪目标判别能力强的目标跟踪算法是计算机视觉领域一个急需解决的任务。本文立足于前人丰富的研究成果,并对基于暹罗(Siamese)网络的目标跟踪方法进行了深入研究,其一是对训练数据集进行了更适合目标跟踪的数据增强(Data augmentation),其二是对网络进行了高效的多层特征聚合(Multi-layer feature aggregation)。所提出的新算法命名为Di MP+,主要过程如下:(1)首先对训练数据集进行数据增强,新引入颜色抖动(color jitter)以及自定义运动模糊(motion blur)数据增强策略以生成更适合目标跟踪的训练样本,提高训练的质量。(2)然后改进ResNet-50特征提取网络,由于大的卷积步伐会导致定位准确度的降低,本文将第三层与第四层的步伐从2降为1。另外,为了实现后续的多层特征聚合操作,同时降低计算量,在第三层和第四层之后分别加入Conv3与Conv4进行特征的提取,并将这两个卷积核的通道数都设为1024。(3)然后将Conv3与Conv4的输出进行多层特征聚合,将低水平的细节特征与高水平的语义特征聚合,来获得更具有判别力的特征图。(4)最后将输出的特征图通过模型预测器中进行在线更新,输出最终的目标位置。实验结果表明,所提出的算法在VOT2018数据集的平均期望覆盖率(EAO)评价指标上比基线算法提高了4.88%,在UAV123数据集的成功率和精确率指标上比基线跟踪器分别提高了4.5%和4.4%,在La SOT的测试集成功率和精确率指标上比基线跟踪器分别提高了9.2%以及11.4%,充分证明了改进后的模型具有更强的判别力,能够有效地提升跟踪的性能。
其他文献
在党的十九大报告中,习近平总书记多次明确提出“不忘初心,牢记使命”,在建党百年之际,青年学习党史,可以鉴往知来,增强历史自觉,为新时代全面建设社会主义国家而不懈奋斗。追根溯源,北京地区党史的开端便是1920年10月成立的北京共产主义小组,该小组成功领导了北京地区乃至北方地区最初的共产主义运动,为中国共产党的创立做出了重要贡献。研究北京共产主义小组与中国共产党的创立,目的是通过对相关史料的挖掘,尽可
肝硬化为临床常见的慢性进行性疾病,随着病程的进展,最终可发展为肝癌,具有较高的死亡率。肝硬化疾病的早期诊断,有助于后续进行相应的治疗,提高患者的生存质量,是医学领域重要的研究课题之一。本文依据计算机视觉、机器学习等相关的理论和方法,结合临床诊断的先验知识,分别从肝硬化高频超声图像的肝包膜和肝实质两部分出发,实现了肝硬化分期的辅助诊断研究。本文的研究主要涉及以下内容:肝包膜自动提取算法;基于肝包膜形
“红船精神”是在时代发展变化的过程中,在结合时代特点的基础上,对中华民族优秀传统文化不断推陈出新,进行创造性转化的成果。作为中国共产党革命精神的源头和奠基,“红船精神”不断创新,与时俱进,在不同的历史时期增添和发展了新的内容,焕发了新的生机活力。本文从马克思主义总体性方法论出发,把握“红船精神”的历史生成、科学内涵,利用史实资料,回到历史现场,从获取到的历史资料出发得出结论。在研究的过程中,将时间
培育青年奋斗精神是开启全面建设社会主义现代化国家新征程的重要内容。青年作为社会主义现代化建设的生力军,承担着实现民族复兴的历史重任。新时代青年富有奋斗朝气与活力,具有创造力与创新意识,志向远大、充满自信,但同时部分“精致利己主义”、“佛系”青年奋斗意志消沉,行为懈怠,甚至引致不良朋辈同化效应,给教育事业和青年工作带来严峻的现实挑战。新时代青年正确理解为何奋斗、如何奋斗等成为当前青年教育亟待解决的重
金融市场一直在现代社会经济中扮演着重要的角色,而金融相关新闻与金融市场之间存在着相互作用。分类金融类新闻文本可以帮助金融个人或金融机构掌握某一子类中更详细的新闻,从而做出正确的决策。特别是对于专业的财务专家而言,经过分类,详细且有效的金融文本可以掌握当前的先进研究技术和未来的可能研究方向,全面了解网络中的金融信息。现阶段的文本分类多是根据现有的公开数据集进行研究,很少有针对专业领域内的文本分类,这
近年来,随着我国城市现代化的迅速发展,人们在日常生活和工业生产中对地下管线的依赖日益显著。同时地下管线也在不断扩张敷设或改建,并且越来越错综复杂,需要对地下管线进行科学而有效的管理,其中涉及到诸多技术,增强现实可视化是其中重要的研究方向之一。传统地下管线信息系统的二维数据表达已不能满足当前用户的需求,随着移动增强现实技术的快速发展,Web AR技术作为其中的一种,将其应用于地下管线管理与规划工作成
线性控制是一门成熟的学科,有着悠久的研究历史。但是在实际的控制系统中,非线性系统更加普遍,系统不可避免地含有时滞、外界扰动、不确定性、多样性等一系列因素的影响。因此,针对非线性系统的研究是十分必要且具有挑战性的。在过去几十年中,非线性系统的状态估计问题获得了人们极大的重视。所谓状态估计是指根据可获取的测量数据来估计系统的内部状态。通常,对系统的输入和输出进行测量而得到的数据只能反映系统的外部特性,
师生互动是提升思想政治理论课教学氛围的重要方式,也是改善教学质量的有效手段,关乎教学任务和目标的实现。高效、充分、深入的师生互动有利于提升大学生思政课获得感,推动思政课改革创新,为培育社会主义建设者和接班人提供有效保障。当前部分思想政治理论课存在学生主体地位不明确、互动频次低、互动方式单一、情感交流不够深入等问题。因此,如何推动师生有效互动、提高师生互动频次成为当前亟待研究的重要课题。本研究通过文
石黑一雄是一位英籍日裔作家,于2017年获得诺贝尔文学奖。《上海孤儿》是石黑一雄的第五部作品,于2000年出版后获布克奖提名,引起了国内外学者的广泛关注。在《上海孤儿》中,石黑一雄从主人公班克斯的视角描述了二战时期中国当时的情况,涉及到对英国人、日本人和中国人的描写。许多学者认为石黑一雄在作品中客观地描述了二战的情况。本文通过分析这部小说对英、日、中三国的人物形象建构,以及主人公与三国警官之间的人
随着自动化技术的快速发展,人类操作员的工作方式发生了巨大的变化,逐渐从手动操作转变为监控自动控制系统的运行状况。研究显示,疲劳是致使操作事故发生的重要原因之一。于是,有关操作员疲劳状态的研究在世界范围内引起了普遍的关注。为了降低操作员疲劳状态下操作自动控制系统而引发事故的概率,保障操作员的安全操作,实时、准确地检测操作员的疲劳状态非常重要。传统的心电疲劳分类方法虽然能有效地识别疲劳状态,但需要采集