【摘 要】
:
目标检测是遥感领域的一个重要研究方向,近些年随着高分辨率遥感卫星的发展,处理高分辨率卫星图像成为一项挑战。当前大多数深度学习目标检测模型依赖于锚框的设计,而锚框需要一定的先验知识来设计针对特定数据集的锚框先验参数,极大地影响了模型的泛化能力。并且锚框还会带来冗余计算,进一步影响了模型的高效性。另外在遥感影像的旋转目标检测中,大多数算法将旋转目标表示为矩形框与旋转角的组合,利用旋转角表达目标的方向信
论文部分内容阅读
目标检测是遥感领域的一个重要研究方向,近些年随着高分辨率遥感卫星的发展,处理高分辨率卫星图像成为一项挑战。当前大多数深度学习目标检测模型依赖于锚框的设计,而锚框需要一定的先验知识来设计针对特定数据集的锚框先验参数,极大地影响了模型的泛化能力。并且锚框还会带来冗余计算,进一步影响了模型的高效性。另外在遥感影像的旋转目标检测中,大多数算法将旋转目标表示为矩形框与旋转角的组合,利用旋转角表达目标的方向信息,而角度变化的周期性,会在角度为边界值时带来损失突变的问题,给模型的稳定性带来了挑战。针对这些问题,本文做了如下的工作:针对旋转目标检测中锚框设计复杂和由计算旋转角度时带来的损失突变等问题,本文基于Pix2Seq框架,将旋转目标框表示为任意四边形,按顺时针方向对四边形的顶点坐标以及类别信息进行序列建模,在骨干网络层使用Swin Transformer提取图像特征信息,由此提出了一个完全使用Transformer编解码器结构的,将图像信息转化为目标序列信息的,基于对目标坐标点序列进行建模的旋转目标检测模型:O~2Pix2Seq。该模型实现了端对端的单阶段不需要锚框的旋转目标检测,简化了旋转目标检测的流程。此外,本文以任意四边形表征旋转目标框,直接对四边形的顶点坐标进行序列建模,避免了旋转角度表征固有的损失突变问题,提高了模型的稳定性。针对本文提出的模型O~2Pix2Seq中由高分辨率特征图带来的编码器计算复杂度过高和小目标检测精度不高的问题,本文使用可形变的注意力模块替代编码器中的多头注意力模块,以降低注意力模块的参数量和计算复杂度,并在可形变注意力模块的基础上,设计了结合多尺度特征的Transformer编码器,使用由骨干网络得到的多尺度特征图提取图像信息,在解码器中针对每个尺度的特征图进行目标序列的解码,从而提高小目标的检测精度。针对本文提出的模型O~2Pix2Seq注意力模块中位置编码的特征表征能力不足的问题,本文使用上下文模式的图片相对位置编码替代编码器和解码器注意力模块中原有的位置编码,提高了注意力模块位置编码的表征能力。本文提出的O~2Pix2Seq模型,在结合了多尺度特征以及图片相对位置编码之后,在飞机和舰船的旋转目标检测中,相比于同样无需锚框的PIo U+Center Net模型,本文的检测精度提升了约4%m AP。
其他文献
随着遥感卫星压缩图像下传模式和数据类型越来越复杂,对新型号卫星地面解码系统性能提出了很大的考验。本文研究内容涉及一种高性能卫星图像解码系统软件的设计与实现,其具备兼容多任务模式的扩展性、保证新任务模式下的实时性和应对复杂故障类型的稳定性。对以上三种高性能需求,开展了系统架构的解耦重构、时延分析与优化和系统故障恢复技术的研究。最终在当前某实时卫星图像地面解码系统的基础上,基于新任务模式的任务特点,针
遥感卫星技术的快速发展和相关产业的迭代升级给配套的地面图像处理系统带来了快速部署的要求和挑战。图像实时解码系统是本课题组为某系列遥感卫星研发的支撑系统,属于地面图像处理系统的一部分,负责将传输到地面的压缩码流实时解码还原成图像数据。现有解码系统软件基于不同卫星型号和不同应用阶段定制化开发,通用化程度不高,不利于当前系统的管理维护和后续系统的快速部署。为此本文对解码系统软件进行通用化设计,面向此系列
随着监控设备制造技术的成熟,大大小小的公共安全摄像头如雨后春笋般冒出。公共事务大到刑侦破案,小到社区管理都要借助监控找到目标行人。因此对目标行人的定位和检索具有较大的现实意义。行人重识别研究如何跨摄像头找到同一行人。但这个课题的前提是人已经被检测出来,即在事先存在的行人检测图上开展的。因此行人重识别研究有一个现实问题:实际成像的全景图片中不只有行人还有大量的背景,即行人位置的不确定。所以对于实际成
基于嵌入式平台的机载地面目标检测在电力巡检、交通监控和战场侦察等军民领域有着重要的应用。随着以深度神经网络为代表的人工智能技术快速发展,机载地面目标检测深度学习方法取得了优于传统方法的性能。但是,深度神经网络参数量大、计算密度高,而机载嵌入式平台重量、体积、功耗等资源有限,难以满足目标检测高时效性要求。为此,本文研究了目标检测深度学习模型的轻量化与优化部署技术,设计开发了基于Hi3559A的机载地
随着深度学习在医学图像领域的发展,利用深度学习实现脑CT图像出血区域分割与脑区定位的研究对临床辅助诊断有着重要的意义。对于CT图像脑出血分割问题,由于主流深度学习方法缺乏对医学图像成像规律的设计,当部分脑出血的特征较弱或较小时,分割效果欠佳。另一方面,对于出血脑区定位问题,计算机视觉领域的定位只能给出目标在图像中的坐标位置,尚缺少在医学意义上的脑区定位的研究。论文对上述问题做了深入的研究,论文的主
星载图像压缩,即在卫星上对所获取的遥感图像进行实时压缩,是星地数传通道带宽受限时下传遥感图像的关键环节。但在实际应用中,此过程存在着关键目标信息损失、图像压缩比不可控、硬件实现困难三个主要问题。针对这些问题,本文提出了一种基于红外小目标检测的可控压缩比实时压缩方法,并进行了硬件实现。首先,进行红外小目标检测算法的设计。选择WSLCM算法作为基础算法,针对其在红外扫描遥感图像中应用的局限性进行改进,
如今,海面目标图像/视频在海防边防、海运贸易中都被广泛应用,但是海面的粼光、波浪和较远的观测距离等因素导致海面目标成像受干扰严重,目标像尺寸小、清晰程度低,难以看清。海面目标“看不清”的问题成为了学者们的一个研究焦点,其中利用软件方式进行超分辨率重建、增强目标信息质量成为了一个解决上述问题的重要研究方向。因此,本文对面向海面目标的超分辨率重建技术开展了深入研究。本文以无人机航拍和固定拍摄的方式实地
现代城市安防监控系统能稳定实时地反映被监控区域的真实情况,为维持社会秩序和保护城市安全提供信息支撑。开展城市安防监控系统的相关研究,对提高城市整体防控水平和推进平安城市建设具有重要意义。目前城市智能安防监控系统主要采用固定可见光视频监控对相应区域进行监测,其监控场景固定导致系统难以全局掌握突发安全事件的情况并无法有效定向跟踪事件后续发展,同时可见光成像导致系统在夜间以及雾雪等恶劣天气情况下适用性较
本论文涉及一种面向卫星图像编解码的地面支撑软件平台设计与实现,此平台主要服务于星载图像压缩单机,为研制阶段提供全链路仿真数据以及解码验证支撑,提高研制效率;为在轨服役阶段提供码流数据分析与异常诊断支撑,帮助快速定位故障。论文针对编码速率优化、解码鲁棒性增强以及码流自动检测技术的难点开展研究,设计并搭建了一套具备编码验证、数据实时解码以及码流自动检错功能的软件平台,提供了对星载压缩单机从研制到服役的
在深度学习快速发展的今天,Tiny目标(小于16*16像素)检测依然是计算机视觉中一个很有挑战性的任务,其在航空遥感目标检测和细小瑕疵检测等领域有其独有的应用价值。由于Tiny目标本身尺度极小且常常背景复杂,当前主流的目标检测模型只适用于常规目标,在Tiny目标上往往性能不佳。本文系统分析了Tiny目标的特点,并对现有的目标检测模型进行了针对性地改进。主要研究工作如下:(1)相比常规目标,Tiny