【摘 要】
:
视觉目标跟踪是计算机视觉的基础研究问题之一,被广泛应用于智能交通、自动驾驶和安防监控等领域,具有巨大的社会和经济价值。深度学习在计算机视觉领域的成功极大推动了目标跟踪技术的发展,其中基于孪生网络的目标跟踪算法将跟踪任务转化为图像间的相似性匹配过程,兼具实时性和准确性而备受关注。由于遮挡、干扰物和视角变换会导致目标外观特征不稳定,而孪生网络跟踪方法仅根据初始帧目标来匹配后续图像,难以有效区分干扰物和
论文部分内容阅读
视觉目标跟踪是计算机视觉的基础研究问题之一,被广泛应用于智能交通、自动驾驶和安防监控等领域,具有巨大的社会和经济价值。深度学习在计算机视觉领域的成功极大推动了目标跟踪技术的发展,其中基于孪生网络的目标跟踪算法将跟踪任务转化为图像间的相似性匹配过程,兼具实时性和准确性而备受关注。由于遮挡、干扰物和视角变换会导致目标外观特征不稳定,而孪生网络跟踪方法仅根据初始帧目标来匹配后续图像,难以有效区分干扰物和目标的外观特征变化,在复杂场景或长时跟踪过程中表现不佳,因此研究目标跟踪重定位算法意义重大。本文针对目标跟踪过程中遮挡、相似干扰造成的特征混淆问题,引入反馈控制理论,以孪生网络目标跟踪算法为研究对象,构建跟踪-判决-校正的目标重定位框架,提出了基于直方图匹配滤波的跟踪判决模型,分别设计了基于结构相似度和对比学习的校正模型,探索了基于反馈理论的目标重定位跟踪方法,有效提高了单目标跟踪的抗干扰和长时跟踪能力。本文的具体工作内容总结如下:(1)针对跟踪过程中的目标丢失难题,首先分析了跟踪失效的种类和原因,通过统计跟踪窗内候选目标中心距离的直方图,发现了跟踪失效前后的直方图U型现象,提出了带阻滤波器-转移判决(Band Rejection Filter and Transfer Arbiter,BRT)模型,可有效检测目标丢失现象;其次提出了基于结构相似度(Structural SIMilarity,SSIM)的跟踪校正模型,利用最小相似度原则构建目标模板集,根据KM算法和最大结构相似度准则遴选正确对象实现跟踪校正。仿真实验表明,所提方法能够及时发现跟踪失效并准确校正,提高了算法的跟踪性能。(2)针对目标跟踪的小样本任务特性,引入自监督学习理论,基于Sim CLR网络提出了一种基于动态对比学习的跟踪校正模型。首先根据BRT模型的判决结果设计了两种样本生成模式,其次提出了基于中心一致性的数据增强方法,克服了随机裁剪导致的正负样本相似问题;最后,针对结构相似度对几何形变敏感的问题,设计了基于语义SSIM(Semantics SSIM,Se-SSIM)的损失函数,引导Sim CLR网络在线学习目标和干扰物语义特征之间的结构差异,提升校正器的区分能力。实验结果表明,本模型可以有效辨别外观极为接近的干扰物,进一步提升了孪生跟踪算法的跟踪性能。
其他文献
随着集成电路和微机电系统的不断发展,低功耗电子器件逐渐得到了广泛的应用。传统的为低功耗电子器件供电的方式是采用化学电池,但是化学电池存在使用寿命有限、维修成本高及环境污染大的问题。收集环境中可再生能源的能量收集技术则成为化学电池的一种有效的替代品。环境中的超低频(<5 Hz)机械运动中蕴含的能量由于其存在广泛而受到研究者的关注。然而,传统的收集机械能的振动式、摆动式和旋转式俘能器因其输出性能较差及
随着计算机视觉领域的发展,一系列依赖于计算机视觉的应用场景和解决方案纷纷涌现,如自动驾驶、智慧安防等等。这些智能应用技术都离不开计算机视觉中的目标检测这个关键任务。目标检测任务根据输入信息源可以分为多类,本文旨在研究二维图像中的目标检测。该任务可以描述为给定二维图像,输出其中存在的已知类别的目标实例的类别及位置。现有的代表性目标检测方法大都仅仅依靠目标区域的局部特征独立地对每个候选目标进行检测。这
行人检测作为一种计算机视觉任务,能够及时对成像设备产生的图像进行分析处理,为针对行人的后续任务做出保障。由于其在无人驾驶,安全等方面具有重大意义,因此受到了广泛的研究与应用。传统的行人检测方法往往基于单模态的输入数据,如可见光图像,红外图像等。然而单模态数据在特定条件下常常存在缺陷,在处理复杂环境条件下的行人目标时,往往无法获取明确的行人信息,从而使得基于单一模态的行人检测存在较高的漏检以及虚警率
随着遥感技术的飞速发展,遥感卫星捕捉到的视频数据包含了更丰富的地物信息,能更有效地完成城市交通管理、海洋监测、智慧城市等任务。然而,在遥感视频中跟踪对象并非易事。首先,遥感视频通常存在分辨率低、对比度低、视野宽的特性,这意味着视频中的物体密集且相互干扰,因此网络很难提取有效的特征。此外,目前主流的基于孪生神经网络的跟踪方法用于匹配模板和搜索框特征的互相关操作是一个局部线性匹配过程,容易导致语义信息
恒定导通时间(COT)控制的开关电源凭借快速瞬态响应的优点迎来了日益增长的市场需求与研究热度,被广泛用于电信设备、计算机、服务器、汽车电子等众多领域。但传统COT控制的工作原理决定了其存在输出电压精度低、开关频率大幅变化引发电磁干扰等缺陷。在高压宽输入范围的转换器中,大幅变化的占空比使得上述缺陷更为显著。顺应高精度输出电压与高精度开关频率的发展趋势,本文研究了相关理论与现有改进技术,提出了创新的输
近年来,随着人工智能、即时通讯和智能手机的发展,互联网中的各种数据处于指数级增长的状态。特别是对于一些UGC(User-Generated Content,用户生产内容,也称UCC)平台,用户可以随时随地将自己创作的图片、视频或音频等不同类型的多媒体数据上传到软件平台上。因此,如何高效、准确地从海量的多媒体数据中检索出用户需要的内容是一个具有应用价值却又极具挑战性的问题。因为不同模态数据的底层特征
随着晶体管尺寸逐渐接近物理极限,高速集成电路设计面临的问题及挑战也越来越多,使得集成电路的性能和集成速度逐渐放缓。而三维集成技术由于其集成度更高、互连延迟更低并且可以实现异质集成而得到了广泛研究。其中,硅通孔(Through Silicon Via,TSV)的研究已经变成一个重要课题。虽然TSV的引入存在许多优点,但会给系统的电源完整性带来影响。例如,TSV的大量应用会为系统引入额外的面积,同时,
近年来,随着BCD工艺的发展,智能功率集成电路(SPIC)逐渐在汽车电子,航天航空,智能家居等领域发挥重要作用。电机驱动电路作为智能功率集成电路的核心模块,正不断朝着低成本,高可靠性和高集成度等方向发展,在中小功率设备中广泛使用并且不可或缺,市场前景非常广阔。如今我国正大力发展集成电路行业,对集成电机驱动电路的研究必不可少。本文从研究小功率电机桥式驱动器集成电路设计出发,围绕提高系统集成度,针对芯
在早期研究中,隐身飞机能够凭借其低可探测性来进行战区突防,完成防空区域中的侦察、支援、打击等任务。随着反隐身技术不断发展,如今单纯依靠隐身飞机自身的低可探测性已经难以完成作战任务。为了提高隐身飞机的作战效率,需要建立防空雷达的探测概率模型,根据模型规划出一条适合隐身飞机的航路。该航路不能有超过探测概率阈值的航路点,还要满足隐身飞机的基本机动性能约束。由于实际的战场环境复杂多变,对不同场景下的隐身飞
随着知识图谱在学术界和工业界的广泛研究和普遍应用,完善与更新知识图谱数据,提升知识图谱质量成为亟不可待的任务,知识表示学习作为知识图谱补全重要的上游技术越来越受到人们的关注。知识表示学习的目标是将知识图中实体和关系嵌入到向量空间中,使它们的语义关联以可计算的形式更好地表达。知识表示学习广泛应用于实体/关系预测与补全等场景。大多数知识表示学习模型基于图结构本身的实体/关系信息,如翻译模型、卷积/图神