基于迁移学习的跨域目标检测算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:chibi2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络的发展,基于深度学习的检测算法已经取得了很好的检测效果。然而,这些检测算法都要求训练集与测试集必须拥有相同的数据分布。一旦环境发生改变,就会使得检测模型性能严重降低。这需要重新收集新环境下同分布的数据,并且需要制作相应的训练标签。在许多的实际应用场景中,重新收集数据、制作标签是非常费时费力的。于是,研究在检测中如何对两个不同域进行知识迁移引起了广泛的关注。跨域目标检测就是解决这一问题的任务,其旨在利用源域知识使检测模型能够很好地泛化到无标签的目标域上。本文着手于这一任务展开研究,针对当前所面临的挑战和实际应用中的问题提出了两个基于迁移学习的跨域目标检测算法,有效地提升了跨域检测性能。主要工作和贡献如下:(1)提出了一种基于隐式域不变特征挖掘的跨域目标检测算法。现有的跨域目标检测算法主要采取迁移学习中的对抗思想来对齐两域分布并提取图像中的显式域不变特征,从而缓解域差异。然而,这些算法都存在一个严重的问题,它们都忽略了隐含在域私有特征下的有用知识,即隐式域不变特征。显然,忽略这些知识会导致检测器的性能降低。因此,本文提出了一个跨域检测算法IDF(Implicit Domaininvariant Faster R-CNN)来充分挖掘隐式域不变特征。其主要由一个双分支结构构成:主支路负责学习显式域不变特征并完成分类和定位;次支路通过非对抗的域判别器和基于跨域生成的伪标签学习域私有特征下的有用信息,并通过双注意力机制引导的特征感知把有用信息传递给主支路。此外,双注意力机制模块还可以互补式地加强双分支的特征学习。大量实验表明,本算法在不同的域适应场景中都取得了好的效果。(2)提出了一种复杂场景下通用的跨域检测算法。当前的跨域目标检测算法都依赖于一个过于理想的先验假设——源域和目标域具有相同的标签空间。由于真实场景下检测类别的多样性,这种先验假设极大地限制了检测器在实际场景中的应用。因此,本文在目标检测领域提出了一个更加符合实际应用场景的任务设置——通用域适应目标检测(Universal Domain Adaptive Object Detection,UDAOD)。在UDAOD中,检测类别被分为了域公共类和域私有类,如何解决域私有类在对齐过程中带来的负迁移问题是一个重要的挑战。为了解决这个问题,本文设计了一个通用的跨域检测算法,其主要由一个动态的类别感知定量衡量器和一个权重手术均衡化构成。前者可以根据存储的每个类别的中心特征进行无偏加权,从而抑制掉域私有类的负迁移影响;后者进行权重极化,使得权重约束更加有效。大量实验表明,本算法可以有效地应对跨域目标检测在更复杂的应用场景中所面临的挑战。
其他文献
机械旋转可重构反射阵天线是通过改变圆极化反射阵元的旋转角度,来调节阵元的反射信号相位,实现特定空间指向上的波束聚焦的一种新型可重构反射阵天线,具有结构简单、易于扩展、相位调节精度高等优点。但因其特殊的旋转结构,阵元的反射相位相对于传统的固定指向反射阵天线来说是可变的,具有一定的随机性,因此在使用之前需要对阵元的初始角度进行检测和补偿,以提高波束指向的精确度。本文提出了一种基于多目标位移测量雷达技术
学位
随着神经科学与计算机科学的推进,深度学习不仅在传统的图像、语音等信号处理领域不断刷新指标,而且逐渐开始被其他专业领域所关注,目前已在金融、医疗甚至社会学研究等多个行业都取得了突破性进展。随着深度学习算法被越来越多领域所接受和使用,专业领域的研究者迫切需要能对算法进行便捷地测试验证,并将成熟算法快速落地部署,形成生产力。但深度神经网络因其存储密集、计算密集等特点,加之应用场景对硬件资源的限制,对软、
学位
弱视容易引起人体视力障碍以及视力丧失,及时且准确的诊断对于弱视的治疗十分必要。现有研究表明异常的双眼竞争是弱视的可能发病原因,因此研究双眼竞争对于弱视诊断具有实际意义。视觉诱发电位是视觉电生理技术中的一种,可以客观地对受检者的视觉系统做出评估。视觉诱发电位中的mf VEP(Multifocal Visual Evoked Potential,多焦视觉诱发电位)总体检测时间较短,既可以检查到眼底整体
学位
深海电动云台是一种重要的深海探测辅助设备,可搭载深海摄像机、深海照明灯和声呐等小型设备,通过角度调整实现更好的观测效果,因此,在海洋工程和海洋科考领域受到了广泛应用。然而,目前我国并无国产深海电动云台产品,仍受到欧美垄断的制约。为促进深海电动云台的国产化进程,论文研究了深海电动云台控制系统,主要进行了深海电动云台步进电机驱动控制器设计和深海环境下的云台高精度控制研究等。论文研究了步进电机工作原理和
学位
随着中国经济社会的迅猛发展以及基础设施的逐步完善,保障交通安全特别是疲劳驾驶检测成为国内外研究热点,而推广疲劳驾驶检测系统的关键问题是如何在保证可用性的同时提升疲劳驾驶检测的准确度。面向物流车驾驶的实际应用场景,本文提出一种基于深度学习的定制化疲劳检测方法。通过驾驶员功能近红外光谱成像(Functional Near-infrared Spectroscopy,f NIRS)数据训练模型,对驾驶员
学位
半导体功率器件能够提高电能转换效率,对实现我国“双碳”目标极其重要。场截止绝缘栅双极型晶体管(FS IGBT)是目前最前沿的半导体功率器件之一,其研究重点主要聚焦于优化关断损耗与导通电压的折中关系。将超结结构引入场截止IGBT可改良这一折中关系。在实际应用中,功率器件会碰到一些极端工况,如:大电流关断、短路等恶劣场景,很容易导致器件损坏。因此在优化IGBT折中关系的同时也需要格外考虑器件的可靠性。
学位
近年来,随着物联网的快速发展,其数据的安全可信问题成为业内非常重要的研究内容,区块链以其天然的安全优势为物联网的安全可信问题提供了一类可行的解决方案,迅速将物联网与区块链技术的融合研究推向热潮。但区块链采用算力不菲、能耗昂贵的hash难题、数字签名、共识算法等技术作为安全机制,致使其能耗昂贵、吞吐量低、延迟冗长的低效短板不能满足物联网实际应用中的系统能效高、事务处理吞吐量大、处理及时性强的高效需求
学位
由多种无线通信技术融合形成的异构无线网络(Heterogeneous Wireless Networks,HWNs)能有效整合不同网络的资源,为海量的各类终端提供高质量网络服务。其中,网络切换技术的研究对于终端在HWNs中无缝漫游有重要的意义。随着新兴的各种无线技术快速深入地融合到千行百业之中,处于“万物互联”中的海量终端携带着多样化的业务使用户对于网络服务的体验提出了更高的要求。如何在由终端移动
学位
行人重识别(Person Re-Identification,Re ID)是分布式多摄像头监控中的一项基本任务,旨在对不同摄像头下的相同行人进行匹配。随着深度学习的迅速发展,传统可见光下行人匹配的精度大幅度提升。然而,深度神经网络存在的缺陷是需要大量有标签数据进行训练。在开放环境下,为每一个感兴趣的目标场景收集标注完备的行人数据是不现实的。另外,对于某些行人外观变化剧烈的场景(如可见光-红外跨模态
学位
随着社会需求的不断改变以及各种工业、通信技术的发展,电子设备和仪器也设计得越来越复杂,通常需要数米甚至数公里的电缆传输电力、数据和控制信号。因此通信电缆在确保各种电子设备与仪器的正常中起着至关重要的作用,各系统间使用的连接电缆一旦发生损坏,将导致系统无法正常工作。实时检测电缆状态对确保系统稳定性和降低维护成本至关重要。反射法常用于检测电缆中的故障。然而,该类方法无法有效识别软故障,不能对电缆故障严
学位