【摘 要】
:
目标检测与实例分割是计算机视觉的两大经典任务,在文本、车牌、行人、遥感检测及无人驾驶等多个领域有着重要作用。目标检测需要在一张图像中识别出给定类别范围内的所有物体,并且用一个矩形框将物体框出来。而实例分割则是用掩膜来为每个实例打上像素级标签。近年来随着硬件设备GPU的计算力大大提高,以及卷积神经网络(CNN)的快速发展,深度学习方法已成为包括目标检测在内的多种计算机视觉领域的主流方法。本文将着眼于
论文部分内容阅读
目标检测与实例分割是计算机视觉的两大经典任务,在文本、车牌、行人、遥感检测及无人驾驶等多个领域有着重要作用。目标检测需要在一张图像中识别出给定类别范围内的所有物体,并且用一个矩形框将物体框出来。而实例分割则是用掩膜来为每个实例打上像素级标签。近年来随着硬件设备GPU的计算力大大提高,以及卷积神经网络(CNN)的快速发展,深度学习方法已成为包括目标检测在内的多种计算机视觉领域的主流方法。本文将着眼于改进目标检测和实例分割两大任务框架中的核心部件,包括深入剖析在目标检测中边界框回归损失函数的优劣,以及在后处理阶段所广泛采用的非极大值抑制(NMS)所面临的不足。具体来说,边界框回归是目标检测的关键阶段。在现有的方法中,普遍采用的损失函数均为Ln范数形式,这类损失函数不适合于优化评价的度量IoU。最近IoU损失和广义IoU(GIoU)损失被提出以优化IoU度量,但仍然面临着收敛缓慢和不准确回归的问题。通过引入两个框之间的规范化距离,本文提出距离IoU(DIoU)损失函数,其相比IoU和GIoU损失具有更快的收敛性。更进一步,本文总结了边界框回归中的三个重要几何因素,即重叠面积、中心点距离、宽高比,基于此提出完全IoU(CIoU)损失函数,其具有更快的收敛性和更好的性能。通过将DIoU和CIoU损失函数纳入到最先进的目标检测与实例分割算法中,如YOLOv3、SSD、Faster R-CNN、YOLACT及Blend Mask-RT,本文获得了显著的性能改进。对于后处理阶段,使用最为广泛的非极大值抑制(NMS)是一种贪婪算法,采取IoU为判别指标,且以顺序处理的方式逐一确定一个框是保留亦或剔除。它面临着两个问题:第一,仅使用IoU作为判别准则对有遮挡的案例不够适合。第二,顺序处理是一种极为耗时的方法,无法充分利用GPU进行加速。针对第一个问题本文提出DIoU-NMS,使用DIoU来替代IoU作为判别准则。针对第二个问题,本文还提出Cluster-NMS,一种通过矩阵之间运算实现的可GPU加速的NMS,极大地提升了NMS的处理速度,且几何因子也可以很轻松地纳入到Cluster-NMS中,以进一步提升平均精度与平均召回率。大量实验证明了所提方法的有效性。
其他文献
令G是一个有限、简单、无向图.图G的正常全k-染色是一个映射(?):V(G)∪E(G)→{1,…,k},使得V(G)∪E(G)中任意两个相邻或相关联的元素都染上不同的颜色.令f(v)=∑uv∈E(G)(?)(uv)+(?)(v),图G的k-邻和可区别全染色是G的一个正常全k-染色,并且使得对每条边uv∈E(G),都有f(u)≠f(v).图G的所有邻和可区别全k-染色中最小的k称为图G的邻和可区别全
小学生的写作能力是语文教学中培养的重要能力之一,作文不仅仅是学生对词句掌握情况的展现,更是对其观察能力、价值观等方面的培养。同时,通过写作可以帮助学生开拓思维、提升审美,因此生活化教学对语文写作来说具有重要的帮助作用。本文基于核心素养的背景,本着建立生活化教学理念、丰富教学方式、增添更具生活情境的教学氛围,来引导学生写作能力的提升,展开语文写作教学研究,并提出相应策略,以期能为小学语文写作生活化教
针对发射脉冲间载频、重频和初始相位联合捷变情况下雷达目标检测问题,研究了一种基于脉冲同步对齐技术和变DFT因子法的目标检测方法,首先针对脉压后的回波进行快时间维的初相相位项和距离相位项的补偿,然后对补偿后的信号在慢时间维上进行同重复周期且同频脉冲信号的等效变换,以实现相参积累完成目标检测.该方法克服了脉间捷变波形相位不连续导致的无法相参积累问题,实现了相参积累检测目标的效果.仿真结果表明,该方法对
本文主要研究了完全交上的Hirzebruch亏格.本文总共分为五章:第一章,介绍完全交与Hirzebruch亏格相关的研究背景以及本文的研究方法,研究结果和创新性.第二章,我们以完全交的(?)亏格和α不变量为例子来引入虚拟Hirzebruch亏格并给出完全交经典Hirzebruch亏格的计算公式.第三章,我们介绍N级椭圆亏格并指出完全交的N级椭圆亏格在尖点处有上界或下界.第四章,我们考虑了酉流形上
研究了脉间频率捷变的末制导雷达的抗噪声调频干扰性能,建立了噪声调频干扰信号模型及脉间频率捷变雷达模型,开展了干扰效果仿真对比研究。仿真结果表明:脉间频率捷变调制对抗噪声调频干扰措施有效。本研究内容可为末制导雷达抗噪声干扰设计提供依据。
胶质瘤是常见的一种恶性脑肿瘤,具有形状不规则,边界模糊和不同程度侵袭性等特点。由于人脑特异性和复杂性,从多模态脑磁共振图像中准确分割出肿瘤是不易的。肿瘤区域相比于人脑正常组织和背景区域占比过小,导致数据集前景背景类像素严重不平衡。在利用深度学习框架学习目标特征时极易受到背景类特征的影响,无法有效训练模型。为解决脑肿瘤图像分割问题中的类别不平衡问题,本文主要提出以下两种方法:1.基于Mask RCN
本文提出一种高效、高精度的数值方法来研究偶极玻色-爱因斯坦凝聚态(Dipolar Bose-Einstein condensates,简记为DBEC)的基态激发,该激发由平均场基态附近的具有偶极-偶极相互作用(Dipole-Dipole Interaction,简记为DDI)的Bogoliubov-de Gennes方程(简记为BdG方程)来描述。本文首先研究BdG方程的解析性质,得到可作为数值方
绝对值方程问题是一类特殊的优化问题,在众多数学领域中,许多问题可通过转化成相应的绝对值方程组模型来解决,由此该课题是优化界研究的热点问题之一.目前,标准绝对值方程问题已被许多专家学者们推广到更广泛的框架下,将欧氏空间中标准绝对值方程组推广到二阶锥框架下(即为二阶锥绝对值方程组)或者是圆体锥框架下(即为圆体锥绝对值方程组).二阶锥绝对值方程问题可等价转化为相应的二阶锥互补问题,对其求解也就可以等价变
随着保险行业的高速发展,市场竞争态势日渐激烈,风险挑战明显增多,其中一类就是道德风险。在保险行业,由信息不对称导致的道德风险问题逐步凸显,它的发生不仅阻碍保险业的发展,也导致了市场资源配置的低效率。因此,基于道德风险影响下的保险相关研究是必要的,它为保险公司防范道德风险提供了理论支撑,对提升保险公司的投资决策能力,稳定保险业的运作经营具有积极意义。随着经济的快速发展和保险规模的扩大,保险公司正面临
<正> 笔者自1982年以来,运用辨证治疗之法治疗12例失眠症。其中病程长者6年,短者1年,均为服西药无效者。经余诊治,结果治愈7例,有效2例,无效3例。分型用药:肝气郁结用甘麦大枣汤合四逆散加胆草、大黄;肾阴亏虚,相火妄动用甘