基于动态样本分配和均衡损失及特征增强的目标检测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:fairstone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉研究领域的一个基础课题,在自动驾驶,工业制造以及医疗等应用领域也有重要的应用价值。其中,目标的定位精度不仅仅是衡量目标检测的重要指标,对其应用也有显著的影响。本文以经典的Faster R-CNN为例,从样本分配、网络结构以及损失函数三个角度出发对模型进行分析和改进,以提升模型的定位精度。主要研究工作简述如下:(1)提出了基于动态样本分配的目标检测算法。原始的目标检测算法通常是基于固定的Io U(Intersection over Union)阈值来进行正负样本分配的,Io U阈值的大小会影响到正样本的数量和质量。阈值过大导致正样本很少,从而出现正负样本不平衡问题,阈值过小则正样本质量不行,从而导致模型的定位精度不足。为解决这个问题,本文提出了动态的正负样本分配算法,在整个训练过程中动态地调整Io U的阈值,使得正样本的数量和质量都得到保障,通过使用高质量的正样本进行训练,可以使得模型定位精度更高。(2)设计了基于特征聚合与增强模块的特征金字塔结构。原始的FPN(Feature Pyramid Networks)高层特征缺乏足够的细节信息和感受野,导致很难对目标进行精准定位。为了解决这个问题,本文设计了特征聚合与增强模块,其中特征聚合模块通过使用空洞卷积和池化来聚合不同感受野大小的特征,提升模型的感受野;特征增强模块首先使用注意力机制对融合后的低层特征进行特征增强,然后将该特征融合到高层特征中。特征聚合与增强模块使得金字塔各层特征具有更加丰富的信息,同时由于具有更大的感受野和全局信息,可以帮助模型进行更高精度的定位。(3)提出了基于均衡损失函数的目标检测算法。回归网络中通常使用Smooth L1作为损失函数,该函数对简单样本(预测框和真实框比较接近)的梯度较小,难样本的梯度相对较大,导致网络的训练会被难样本主导,因此简单样本没有得到充分训练,从而影响了定位的精度。针对这个问题,本文设计了均衡损失函数,可以增大简单样本的梯度,使得其得到充分训练,最终可以提升模型的定位精度。在VOC和COCO等公开数据集上的一系列的实验,充分验证了本文所提三个方法的有效性。同时,实验也表明所提三个方法综合得到的模型能取得更佳的效果。
其他文献
随着互联网和通信产业的飞速扩张,微波射频电路和系统越来越受到各界科研工作者的重视。面对划分地越来越细的频段,多频的元器件及电路设计成为研究热门。多通带滤波功能性融合器件是一种将多路滤波功能同时集成到传统微波器件的单体多功能融合器件,能够在射频电路前端的多个关键节点处滤除干扰信号以及非线性器件产生的交调和谐波信号。本论文主要针对高选择性多通带带通滤波器,高隔离度多通带滤波功分器以及多通带开关切换冷热
学位
应用自适应光学(Adaptive optics,AO)技术校正光束经随机介质传输时的波前相位畸变,消除其对成像系统的影响。当波前像差快速变化时,迭代时间长、收敛受限的传统算法无法达到自适应光学系统实时校正波前的要求。因此,本论文提出了基于贝叶斯优化(Bayesian Optimization,BO)下的卷积神经网络(Convolutional Neural Network,CNN)的非迭代式波前校
学位
婴幼儿血管瘤,以下简称血管瘤,是小儿临床最常见的软组织肿瘤之一。血管瘤1岁之前的发病率高达10%-20%,大部分可自动痊愈,但是部分严重的会威胁到婴儿的正常生长乃至生命。准确判别血管瘤风险等级并采取相应的治疗措施,这一工作目前主要是由具有较高专业素养的儿科医生手动完成。高专业素养儿科医生的缺失,部分家长对血管瘤风险的忽视,容易耽误血管瘤的及时治疗。使用人工智能的方法,对血管瘤的状态做出自动且准确的
学位
基于MRI图像的自动分割算法在计算机辅助诊断及治疗等方面有着广泛应用。近年来,基于深度学习的图像分割技术快速发展,但在精确度和鲁棒性上依然不能完全满足严苛的临床要求。比如,现有分割方法有时难以区分器官与组织的边界,对小器官的分割效果也不甚理想。本文针对MRI图像多器官分割中的难点,研究了网络特征的间隔弥合问题及解耦问题,并通过改进网络结构及损失函数,提高分割精度。在MRI图像多器官分割网络中,经常
学位
隐身能力是新一代军用武器的重要特征之一,隐身技术发展在军事领域具有重要意义,其关键在于降低目标的雷达散射截面(Radar Cross Section,RCS)。目前研究多数集中在镜面散射的RCS缩减问题,而在实际应用中,对于目标的细长部位,通常还存在较强的表面行波散射,不可忽视。本研究以高阻抗表面(High Impedance Surface,HIS)为研究对象,同时结合频率选择表面(Freque
学位
非小细胞肺癌(Non-small-cell lung cancer,NSCLC)是一种最常见的肺癌类型,具有高发病率与死亡率的特点。准确地预测NSCLC癌患者的生存期与分子亚型可以为临床医生制定个性化治疗方案提供指导,对改善患者预后、提高长期生存率具有重要意义。随着高通量技术的迅速发展,NSCLC患者的临床与多组学数据被大量收集,为开展广泛的预测研究提供基础。已有研究表明融合临床与多组学数据对NS
学位
随着自动化、智能化逐渐普及以及计算平台性能的提高和成本的降低,机器视觉技术在路面等自然场景中有了更多的应用。目前目标检测框架大多使用端对端的深度神经网络结构,需要进行大量的卷积操作,极其依赖GPU硬件的算力,成本较高,且需要大量训练集训练来保证检出效果。本文设计了一个用于垃圾清扫车上的车载垃圾识别算法,用来辅助垃圾清扫车完成垃圾清扫任务。通过车载相机拍摄路面图片,检测出路面中的垃圾目标,根据垃圾种
学位
近几十年来计算机视觉技术飞速发展,自动目标识别技术在民用军用中的作用也日益突出,在行人检测、智能驾驶、无人机作战等实际场景中均得到了广泛应用。随着自动目标识别技术的发展,如何综合地评价基于不同模型的目标识别算法的性能,是实际应用中十分重要的问题。本文针对自动目标识别算法的性能评价问题,以一些目前主流的自动目标识别算法为对象,设计了一套性能评价指标体系,并提出了一种性能评价方法,对目标识别算法在行人
学位
形状匹配问题是形状识别、形状检索、形状模型重建等关键技术的研究基础,主要可分为刚性形状匹配与非刚性形状匹配。其中,非刚性形状匹配问题由于受到复杂变形因素的影响,实现匹配难度更大,也更具有挑战性。传统的非刚性形状匹配算法,大多基于手工设计的特征描述子,通过特征之间的相似性度量来实现。然而在形状拉伸、扭曲、等距变形等复杂变换影响下,手工设计特征往往存在区分性差、鲁棒性低等问题。近年来,深度神经网络由于
学位
<正>2020年初,新冠肺炎疫情爆发,对全球民航业带来前所未有的巨大冲击,必将深刻影响未来发展格局。现就疫情之后全球航空业的发展情况进行分析。全球航空业发展基本特性特性1:从历史数据来看,全球民航市场发展与经济社会发展速度、发展质量紧密相关,平均年增长率约为全球GDP平均年增长率的2倍或以上,在经济稳定发展时期民航增长也保持稳定态势,但经济波动时民航的波动幅度远大于经济波动(如图1),堪称经济的"
期刊