【摘 要】
:
目标跟踪是计算机视觉领域最重要和最具挑战的基本任务之一,其目的是给定第一帧中目标信息,在后续帧中估计该目标的位置和尺度,目标跟踪任务可以被分解为分类和回归任务。分类任务通常通过对目标的外观进行建模,使用外观模型定位视频帧中的目标。回归任务有多尺度搜索、边界框回归方法。本文针对目标的外观建模和尺度估计两项基本问题进行研究,以提高分类的准确性和尺度估计的精确性,并将之嵌入到基于深度学习的判别式跟踪框架
【基金项目】
:
国家自然科学基金项目:基于深度神经网络和记忆机制的复杂环境目标跟踪研究,No.61663031; 江西省科技支撑计划项目-工业领域一般项目:面向视频监控的跨摄像机目标跟踪关键技术研究,20192BBE50073;
论文部分内容阅读
目标跟踪是计算机视觉领域最重要和最具挑战的基本任务之一,其目的是给定第一帧中目标信息,在后续帧中估计该目标的位置和尺度,目标跟踪任务可以被分解为分类和回归任务。分类任务通常通过对目标的外观进行建模,使用外观模型定位视频帧中的目标。回归任务有多尺度搜索、边界框回归方法。本文针对目标的外观建模和尺度估计两项基本问题进行研究,以提高分类的准确性和尺度估计的精确性,并将之嵌入到基于深度学习的判别式跟踪框架下,在多个跟踪数据集中验证它们的性能。本文主要工作内容如下:(1)提出一种用于目标跟踪的尺度自适应滤波器外观建模方法。当前SOTA(state-of-the-art)的跟踪器依赖于预先固定尺度的相关滤波器学习目标的外观模型,进行目标的粗略定位。固定尺度的滤波器感受野比较单一,无法捕获不同通道中不同尺度的外观信息,无法很好地适应目标的外观变化,这样的目标外观模型对于目标表观变化的表示能力存在上限。本文首先分析了不同尺度的相关滤波器对目标的外观模型学习的影响。在此基础上,提出多尺度自适应的滤波器学习目标的外观模型,并使用最陡下降法求解外观模型。同时,设计了一种基于多尺度卷积模块分类特征提取器,为后续目标外观模型学习提供表示能力更强的特征。(2)提出一种结合IOU(Intersection over Union)和中心点距离预测的尺度估计跟踪算法。现有的跟踪算法通常采用多尺度搜索、边界框回归方法进行跟踪过程中的目标尺度估计。基于IOU预测的边界回归尺度估计方法通过估计视频帧中候选框与真实边界框的IOU训练边界框回归分支,在推理时通过最大化IOU对初始化边界框进行微调取得目标的尺度。本文首先对基于IOU预测的尺度估计模型的参数学习进行了详细分析,发现训练和推理过程将IOU作为度量时,缺乏中心点距离的约束会造成基于IOU预测的尺度不精确。因此,提出能够同时度量IOU和中心点距离的新的度量NDIOU(Normalization Distance IOU),使用该度量预测进行目标的尺度估计。在训练过程中结合IOU和中心点之间的距离进行采样,并通过预测NDIOU训练尺度估计模型。在线推理时,最大化NDIOU微调目标尺度。(3)将以上算法嵌入到判别式跟踪框架,在OTB-100、VOT2018、UAV123、GOT-10K、Tracking Net、La SOT、TC-128七个数据集上进行验证。实验结果表明,基于本文所提出的多尺度自适应外观建模跟踪算法在OTB-100、VOT2018、UAV123、GOT-10K、Tracking Net、TC-128六个数据集上的综合性能优于所有对比算法。本文所提出的基于NDIOU的尺度估计模型跟踪算法在上述的七个数据集上的综合性能也优于用来对比的所有算法。这证明了本文所提方法的有效性。
其他文献
全民抗疫对加强个人健康管理和疾病的自我检测提出了新的要求。必须将疾病的准确诊断落到实处。近年来,基于计算机视觉的医学图像分析等技术因其便捷性、隐私性、快速性、自动性等优势,受到越来越多的关注和青睐,并开始应用于个人健康状况的初步诊断。粪便的异常颜色与异常性状通常表明或预示患有肿瘤或消化系统疾病等风险。计算机视觉和模式识别技术在辅助诊断中的使用降低了传统医学图像诊断中医生主观性、认知差异和疲劳诊断过
随着自动化技术和医疗信息技术的不断进步和完善,越来越多的智能化设备进入我们的眼帘,如智慧药房自动化设备在我们的现实生活中很常见。当我们进入一些规模较大的医院时,去药房取药时会发现,有很多的自动化的发药设备将我们的药品运输到药剂师手中,这极大的简短了我们所取药的时间,因此智慧药房自动化设备在当今的社会扮演着举足轻重的作用。本文主要对作者之前参与的一个项目“机械手式智慧药房”进行研究,通过观察其运行时
随着以人工智能为代表的前沿技术嵌入政治领域,人工智能与现代民主政治相结合呈现出一些新特点,如人—机—物高度融合下的“信息矛盾性”牵引公众舆论、大数据驱动下的“高效科学性”影响政府决策、组织结构扁平化下的“资本主导性”分割政治权力等。正是这些特点促成安全风险的生成,使国家政治安全显现出诸多不同于以往的新动向、新表现。伴随人工智能对国家政治安全的影响日益加深,一些典型案例背后映射出相应的影响机理,主要
在如今社会中,随着互联网科学以及通讯技术的发展与完善,人们之间相互交流更加方便快捷。通讯方式的选择变得更多,构成复杂多变的社交网络,使得信息的传播不在局限于物理空间,信息管理以及与之相关的各种任务也变得越来越重要。但由于复杂网络中的知识传播不同于流行病般的信息传播,因此研究如何构建符合现实知识传播的模型以及如何促进知识传播的策略具有极其重要的意义。本文构建一种新型的知识传播模型,考虑了协作学习和遗
机会网络是一种由大量低成本、短距离无线通信设备构成的自组织网络,通过“存储-携带-转发”的机会通信方式完成消息的传递,具有拓扑时变、网络自组织等特性,在应急通信、智慧交通、环境监测等领域有很大的应用价值。链路预测是机会网络研究中的热点和难点之一,其主要通过已知的机会网络结构等信息预测未来节点之间存在连接的可能性,进而帮助我们理解机会网络的拓扑演化规律,为机会路由协议的设计提供支撑。本文介绍了现有的
自区块链问世以来,它的去中心化等特点引起了诸多研究人员的关注。越来越多的研究学者纷纷涉足这一领域,但是想要对它进行更加深入的研究,就需要从底层开始,剖析区块链的底层架构。截止目前,区块链的改进逐渐成为一个热门的研究方向,但目前国内外相关研究还没有显著的成果。区块链技术最显著的特点为去中心化,它的目的是为了让网络上的节点在不使用中心服务器的基础上相互信任。越来越多的应用采取了这项技术,也因此衍生出不
目标检测是计算机视觉的基础性研究领域之一,它主要由分类与定位两个任务组成,用于检测输入图像或视频中是否存在感兴趣的目标。目标检测在视频监控、医疗诊断及自动驾驶等领域都有着非常重要的应用价值,因此受到了大量研究人员的关注。近几年随着深度学习的快速发展,深度学习研究方法也逐步与传统的检测算法融合,取得了巨大的突破。然而在实际应用中,目标通常会受到光照、拍摄视角和遮挡等因素的干扰,导致目标的形态和外观发
异构蜂窝网络指的是在原有宏蜂窝小区中引入多种小蜂窝接入技术,例如设备间通信(Device-to-Device,D2D)和中继通信(Relay)等,用来满足更多的通信业务需求,其已经成为未来蜂窝移动通信的发展趋势。其中,D2D通信允许距离较近的用户设备之间直接建立通信链路,其数据传输不需要通过基站进行中转。因此,D2D通信可以提高频谱资源的利用率、降低基站的负载和用户的能耗等。其次,在基站和用户设备
铁路是国民经济大动脉、关键基础设施和重大民生工程。《中长期铁路网规划》中提出构筑“八纵八横”高速铁路主通道,为构建现代综合交通运输体系、促进经济社会持续健康发展、实现“两个一百年”奋斗目标提供有力支撑。当国家铁路工程穿越世界遗产地缓冲区,《保护世界文化和自然遗产公约》及《实施世界遗产公约操作指南》明确要求世界遗产的保护和管理应维持或增强其突出普遍价值,为遗产采取所需的适当的法律、科学、技术、行政和
身份信息滥用是社会顽疾问题。文中提出了一种基于区块链的身份鉴证与授权(Blockchain-based Identity Authentication and Authorization, BIAA)机制,该机制要求用户主体在对业务进行身份授权时提供有效身份证件和生物特征信息,确保业务为本人授权;同时将业务信息及身份授权写入区块链账本,进一步实现业务的安全存证与可追溯。为构建该机制,提出了“身份注