基于anchor free的多尺度目标检测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tj_tong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们生活水平的日益提高和生活节奏的加快,人们对省时省力和体验舒适的人工智能技术的需求越来越多,而基于计算机视觉的目标检测任务则是人工智能领域的重要组成部分,智慧城市、自动驾驶、电力巡检以及人脸解锁等应用都用到了目标检测技术。早期的基于深度学习的目标检测模型大多数都利用了先验框(anchor)来降低模型的学习难度,但由于超参数较多、检测器泛化能力受限,近几年,学者们开始重点研究基于anchor-free的目标检测模型,这类模型抛弃了先验框,网络结构优雅且模型的泛化性更强。本文正是以基于anchor-free的FCOS模型为基础,围绕目标检测中的多尺度问题进行展开,主要针对FCOS正样本分配的问题和目标检测模型多尺度推理时受到极大极小目标干扰的问题进行研究和改进,并在病害数据集和COCO数据集上进行实验验证改进算法的可行性和有效性。本文主要创新内容如下:(1)针对FCOS中正样本分配对细长目标采样不均匀的问题,提出了高宽比自适应的正样本中心采样算法,同时针对原中心度真值的长边下降快、短边下降慢的问题,提出高宽比自适应的中心度真值定义,该算法改善了细长目标中心度下降过快导致FCOS的中心度分支训练不充分的问题,通过结合以上两个改进策略,提高了模型对高宽比较大的目标的鲁棒性。(2)FCOS模型训练时,大目标由于面积大往往分配到的正样本较多,而小目标的正样本数量较少,这会导致模型更加重视大目标的学习,对小目标的检测效果不好,针对FCOS的不同尺度目标分配的正样本不均衡的问题,本文在原正样本分配算法的基础上提出固定数量的random-k正样本分配算法,提高了模型对多尺度目标的检测精度。(3)目前的目标检测模型多尺度推理时,由于受到极大极小目标的干扰,容易出现误检和虚检,针对这一问题,本文提出基于多尺度推理的相对注意力模块,通过在训练时将两张不同分辨率的输入图像同时进行训练,同时将不同分辨率的两个分类分支乘以注意力模块输出的掩膜权重并求和一起计算损失,这样可以让模型自己学习如何更好地结合不同尺度下模型的预测结果,最后将该模块与基于逐像素预测的FCOS模型相结合,并在隧道病害数据集和COCO数据集上进行实验验证,改进的网络不仅总体精度有所提升,而且提高了模型对不同尺度目标的鲁棒性。
其他文献
随着工艺制程和设计方法的不断进步,芯片规模和复杂度逐步提高,验证的资源消耗和工作量随之激增。验证作为芯片开发的关键步骤,消耗的时间约占总研发流程的70%,在芯片性能、流片效果以及开发成本上都起着决定性作用。传统的验证方法已难以满足芯片验证的需求,UVM(Universal Verification Methodology)改进了传统的验证方式,其验证平台测试充分且易于移植,具有较高的层次性和复用性
长度是舰船的固有物理特征,基于长度的舰船型号分类是海上舰船精细分类的重要准备工作,对于海用雷达具有重要意义。舰船高分辨距离像(High-Resolution Range Profile,HRRP)反映了其在雷达视线方向上的尺寸、结构信息,具有易于获取与处理的特点,因此基于HRRP的舰船径向长度提取、分类以及识别成为了高分辨对海雷达信号处理的研究热点。本论文在贝叶斯统计分析框架下,对基于HRRP的高
随着无线通信技术的发展,电磁频谱资源开始变得紧张,认知无线电技术作为一种行之有效的解决方案被提出,但是认知无线电存在被恶意干扰攻击的风险。现代战争中,电磁战不可避免,及时识别敌方干扰与我方设备异常具有重要战略意义。电磁频谱监测与频谱异常检测是无线电频谱管理的重要组成部分,可以帮助检测恶意干扰、非法占用等无线电异常,对保障无线电管理和电磁环境评估等具有重要意义。针对目前电磁频谱监测设备体积大、功耗高
随着信息技术的快速发展,海量、高维、不规则等数据特征为信息处理带来新的挑战。图信号处理研究不规则离散域上的信号,为信息处理提供了新思路与重要工具。图信号处理技术将不规则离散数据抽象为图信号,并构建了与传统信号处理类似的理论体系。采样与重建是信号处理的重要内容,目前针对图信号采样与重建的理论研究并不完善,仍处于发展的初级阶段。本文主要研究图信号的重建问题,包括收敛速度更快的重建算法,针对全频带图信号
随着雷达探测技术的快速发展,使得快速、精确地计算目标的雷达散射截面成为我们需要研究的关键课题。由于需要计算的目标散射体大多体现物理尺寸较大、结构相对复杂等特点,在高频入射波照射下,往往会面临目标的电尺寸过大、计算复杂度较高、计算资源不够等问题,因此研究如何利用高频渐近法快速预估目标的电磁散射特性变得尤为重要。本文采用弹跳射线法对目标的电磁散射特性进行分析,为能提高算法的计算效率,本文首先依据三角面
逆合成孔径雷达(ISAR)高分辨成像能够获得目标丰富的结构及运动信息,从而为目标分类识别提供有力的技术支撑,并在空间态势感知与防空反导等领域中发挥着重要作用。对于单一平稳目标,在平动补偿后利用传统的距离-多普勒(RD)算法即可获得聚焦良好的图像。但在实际应用中,ISAR往往面临复杂的多目标观测环境,这将为聚焦成像带来很大的困难。当同一雷达波束内存在多个目标(如飞机编队、多个弹道目标等)时,由于各个
随着雷达探测技术的不断发展,隐身目标的战场生存能力受到了严重的威胁。为提升目标的隐身性能,就需要对目标散射特性进行研究,而衡量目标散射特性的关键指标就是雷达截面(Radar Cross Section,RCS),越低的RCS意味着更好的隐身性能。近年来电磁超表面因其具有灵活控制电磁波的能力而受到科研工作者的关注,利用电磁超表面实现RCS减缩的研究也取得了长足发展。但是,现有利用电磁超表面减缩RCS
在现代生活中,无论是在城市还是农村,无线蜂窝网络已经可以满足绝大部分场景下的通信需求,尤其是在5G技术兴起后,人们在日常生活中可以享受到更高质量的通信服务。但是另一方面,在一些特殊场景下,例如森林火灾、地震甚至战争情况下,使用传统无线蜂窝网络无法做到稳定通信,此时其他通信方式就显得十分重要。对流层散射通信就是一种可靠的超视距通信方式,在很多情况下可以代替卫星通信,减轻卫星通信的压力,并且已经在实践
随着大数据时代的来临,数据存储需求量剧增。NAND Flash因其高性能、高密度、非易失性和低功耗等优点成为目前主流存储介质。单个NAND Flash的容量和速度都远无法达到SSD的大容量和高速的主机接口需求,SSD中普遍使用将多个NAND Flash芯片集成在一起,控制多个芯片并行进行读写操作,来满足固态硬盘的设计需求。目前,PCIe接口的SSD已经进入了企业级市场和消费级市场。与传统SATA接
随着科学信息技术的成熟发展,市场对通信的需求不断增加,为应对复杂多变的通信环境,通信系统中天线的数量也越来越多。可重构天线凭借其可在频率、方向图或极化等方面实现单参数或多参数的重构,使单一天线具备多个天线的功能从而减少天线数量、简化电磁环境而成为天线设计领域的研究热点。石墨烯作为一种新型的二维碳纳米材料,由碳原子在同一平面内以正六边形的形式排列构成。其独特的结构和性质,已经得到了许多领域研究者们的