【摘 要】
:
算法、数据和算力等的进步使今天的目标检测技术在公开数据集上检测效果远超人类。但是算法在落地时,应用场景的数据(目标域)与训练该算法的数据(源域)可能因成像、光照、天气等条件不一致,在图像特征分布上出现较大差异,即领域偏移。领域偏移导致目标检测算法在实际应用时漏检误检增多,效果远不如在公开数据集上的表现。目前解决领域偏移问题主要有两种方案:一是把目标域图像进行标注后重新有监督地训练检测模型,直接得到
论文部分内容阅读
算法、数据和算力等的进步使今天的目标检测技术在公开数据集上检测效果远超人类。但是算法在落地时,应用场景的数据(目标域)与训练该算法的数据(源域)可能因成像、光照、天气等条件不一致,在图像特征分布上出现较大差异,即领域偏移。领域偏移导致目标检测算法在实际应用时漏检误检增多,效果远不如在公开数据集上的表现。目前解决领域偏移问题主要有两种方案:一是把目标域图像进行标注后重新有监督地训练检测模型,直接得到目标域的特征分布。但因为目标检测任务里物体种类较多且数量较大,重新标注成本很高;二是将没有标记的目标域数据与源域数据一起训练,通过迁移学习的方式逐渐对齐源域和目标域的特征分布,该方案被称作领域自适应。领域自适应能避免重新标注数据,但该方法用于目标检测任务的研究刚刚起步,目前提出的算法存在检测速度较慢、特征信息利用不充分、特征错误对齐导致负迁移等问题。针对现有领域自适应方案的三个问题,本文对基于领域自适应的单阶段目标检测算法进行了研究,具体研究内容如下:(1)提出图像级多层次领域自适应方法。首先为了提高检测速度,该方法明确以检测速度较快的单阶段网络为基础网络。其次为了充分利用主干网络提取的特征信息,该方法按主干网络提取的多层次特征图包含语义信息的多少,为它们设计了两种特征对齐模式,以满足不同对齐策略的需要。该方法能充分利用图像特征,加快检测速度。对比实验中,同基线方法相比,mAP提高约2.2%,检测速度提高约50%。(2)提出实例级类别相关领域自适应方法。为了减少实例级对齐时类别错配带来的负迁移,并符合单阶段目标检测网络的网络结构,该方法忽略了实例的真实类别,利用软标签作为权重平衡实例在每种类别上的对齐强弱,避免了类别错配。结合之前图像级多层次自适应方法,对比实验中,综合方案mAP进一步提高约5%。(3)设计了电梯场景领域自适应目标检测系统。结合实际项目需求,该系统对基于领域自适应的单阶段目标检测算法进行封装,并集成了领域自适应训练,模型转换和模型推送等功能,达到研究算法应用方式和检验算法实践效果的目的。
其他文献
在新冠疫情防控期间,人脸识别在病毒流调、无接触通行、目标追踪等方面发挥出重要作用,但此类复杂的自然场景伴有诸多干扰因素,阻碍了识别性能的进一步提升。本文将研究在自然场景下如何改善跨姿态人脸识别任务的表现。该问题面临如下挑战:(1)相比于光照、表情等因素,姿态变化更容易引起自遮挡和外观扭曲等问题,使得原本处于人脸中心区域的显著特征有所缺失,进而发生一种现象:相比于类间差异(即不同对象之间的特征差异)
当前,智能医疗领域由于其旺盛的需求及庞大的发展潜力,成为了人工智能技术重点研发和应用的方向。本文拟针对三维膝关节核磁共振图像中前叉韧带疾病的诊断进行研究,算法框架包括一个前叉韧带病灶区域检测模块,以及一个前叉韧带撕裂程度病理分级模块。在病灶检测模块中,本文建立了以三维卷积核为基础的卷积神经网络,对三维图像中的空间特征和结构特征进行了充分提取;考虑到医疗图像中病灶点尺寸较为固定,因此在训练网络之前先
在云计算不断发展中,软件服务化趋势越加明显,用户通过网络即可使用应用提供的服务,服务慢慢变成应用构建基础,成为云产品的基本形态。FaaS(Function as a Service)以函数为单元提供服务,符合云发展的趋势,并且作为一种新型计算方式成为了云计算未来发展的一个方向。FaaS的出现使用户专心于编写和上传核心的业务代码,由FaaS负责创建和维护相应的计算、存储、网络等资源。用户完成编写并上
根据某篇目标论文寻找相似论文,是科研人员的常见需求,学术论文推荐系统能够帮助科研人员从快速增加的海量学术大数据中过滤提取有效信息。推荐算法是推荐系统的主要研究对象之一,不同的推荐算法适用于不同的数据。学术论文包含多属性特征,既可以使用基于文本特征的推荐算法,也可以根据引文、共引等信息构建同构网络、根据文章、作者、机构等信息构建异构网络,对网络使用基于图特征的推荐算法。现有的论文推荐方法存在许多问题
近年来,随着经济、科技、医疗等的快速发展,在世界范围内,人口数量持续上升。每逢节假日,在旅游景点、购物商场、交通枢纽等公共场所均会出现大量人群聚集的情况,一旦发生异常情况,极容易发生踩踏事故,导致人员伤亡。如果能使用架设在公共场所的监控设备进行实时的人数检测和预警,便能够有效地避免事故的发生。这使得使用监控摄像头进行人群计数成为计算机视觉领域的一个研究热点。此外,人群计数还有更多广泛的应用,例如公
无人机作为一种利用无线电方式控制指挥的无人设备,其控制准确性极大依赖于通信信号的强弱,在复杂场景下容易出现指挥控制困难、设备不兼容、数据传输容易被干扰等情况。因此,需要寻找一种更高效、兼容性更好、更安全的人机交互方法。随着深度学习的发展,出现越来越多的算法来解决在人机交互领域的动作识别问题。但多数方法采用图像+光流的形式进行联合训练,计算成本巨大,且容易受到浅层视觉特征的影响。本文基于姿态检测算法
井间电磁探测是在单井基础上发展起来的一种低频远探测方式,发射端采用磁偶极子源以一定的频率发射电磁波信号,并在相距一百甚至几百米的接收端,对信号进行接收和采集。井间电磁成像是根据接收端获取信号波形的幅度和相位等信息,通过反演迭代得到井间地层电阻率的分布。本文利用积分方程数值模拟的方法对地层电阻率分布进行建模分析,得到井间电磁场响应。然后对各个接收点电磁信号分析研究,分析电阻率变化以及电阻率对比度对电
目前语音识别技术中运用较成熟的高斯混合-隐马尔科夫模型(Gauss MixedModel and Hidden Markov Model,GMM-HMM),其结构简单,实现方便,小数据下训练速度较快。但随着语料库的增大,及语音识别精度的要求变高,GMM-HMM难以穷举所有的文字关系,导致其对数据的适应性差,识别效果不够好,且传统模型使用解析语音的音素信号序列与对应文字进行训练,需对齐语料语音与文字
遥感全天候地表温度产品因不受云雾覆盖影响、长时间序列等优点被广泛应用于气候变化、灾害防控等研究,在青藏高原冰川地区等多云雾地区具有很高的应用潜力和价值。然而目前遥感全天候地表温度产品的空间分辨率多为1 km中空间分辨率,在诸如冰川泥石流等较为精细化的灾害监测中面临空间分辨率不足的问题,进而影响了地表温度的进一步应用。为了提高遥感全天候地表温度产品在青藏高原冰川地区的空间分辨率,本文开展的主要研究工
地表温度(Land Surface Temperature,LST)是地气界面能量交互中的一个关键因子,是地表热辐射的直接表征和多种地气模型的输入参数。热红外遥感是反演地表温度的主流方式,但是受制于物理机制的影响仅能获取晴空条件下的地表温度。被动微波遥感在监测大区域尺度地表温度变化、补足由于云覆盖导致的地表温度时间序列缺失以及协同热红外遥感生成中分辨率(如1 km)全天候地表温度等研究中有着得天独