【摘 要】
:
近年来,深度学习理论发展迅速,在遥感图像分类、分割、检测等任务中得到了成功地实践。相比于传统遥感图像目标检测算法,深度学习方法提取的特征更具完备性,检测精度更高,然而针对具有大尺度变化的目标,其目标检测的效果较差。在遥感图像中,具有大尺度变化的目标相对数据集中其它目标数量较少,符合典型的长尾分布,这是导致大尺度变化目标检测效果不理想的原因。图像数据扩增技术为缓解深度学习的数据过拟合和提升模型的泛化
论文部分内容阅读
近年来,深度学习理论发展迅速,在遥感图像分类、分割、检测等任务中得到了成功地实践。相比于传统遥感图像目标检测算法,深度学习方法提取的特征更具完备性,检测精度更高,然而针对具有大尺度变化的目标,其目标检测的效果较差。在遥感图像中,具有大尺度变化的目标相对数据集中其它目标数量较少,符合典型的长尾分布,这是导致大尺度变化目标检测效果不理想的原因。图像数据扩增技术为缓解深度学习的数据过拟合和提升模型的泛化能力提供了有力的手段。现有针对目标检测的图像数据扩增方法可分为非框级和框级两类,非框级主要针对数据的像素(亮度,对比度,噪声等)做变换,而框级主要针对图像整体作翻转、裁剪、多尺度变换等。这些扩增方法没有考虑到图像内目标的相对尺度变化,且新生成的图像相对原图没有较大的内容变化。本论文围绕遥感图像目标检测深度学习方法针对大尺度变化目标检测中存在的问题,从数据扩增的角度进行了重点问题的研究。本论文在卷积神经网络的数据源端和特征提取端,分别设计了两种数据扩增方法,对目标进行显式和隐式扩增,在多个数据集上的实验验证了所提出扩增方法的有效性。论文主要贡献总结如下:1.提出了一种过采样目标的图像端数据扩增方法,实现了遥感图像中大尺度变化目标检测性能的提升。首先通过初始预测器筛选出数据集中的难例目标以构建难例目标库,然后通过Alias method采样方式指导目标库中的目标做服从原始数据集尺度分布的极大极小变换,将目标以copy-paste的方式合成新图像实现数据集的扩增。所提出方法以Faster R-CNN模型为例在自建数据集Plane-22、AIR-SARShip船舶检测数据集以及CAESAR-Ship数据集上进行了测试,结果表明该方法是有效的,目标平均检测精度AP分别从52.8%提升到56.9%、从27.5%提升到29.3%、从64.2%提升到65.1%。2.提出了一种基于线性内插的特征端数据扩增方法,实现了遥感图像中大尺度变化目标检测性能的提升。输入图像首先经backbone网络进行特征提取获得特征空间,然后根据正样本位置真值匹配特征图中对应的特征区域并展开为特征向量,接着采用线性内插的方式对正样本特征向量作特征间扰动,生成的新特征与原始特征级联后送入目标检测网络的分类分支,最终实现目标的检测。所提出方法以FCOS模型为例在DIOR公测数据集的plane、vehicle类上进行了测试,结果表明该方法是有效的,目标平均检测精度AP分别从39.0%提升到39.8%、从28.8%提升到29.1%。本论文围绕基于深度学习方法的遥感图像目标检测,针对大尺度变化目标检测难的问题,从数据扩增的角度,提出了一种过采样目标的图像端数据扩增方法和一种基于线性内插的特征端数据扩增方法,能够有效地提升大尺度变化目标检测的性能,为遥感图像目标检测提供了新实践。
其他文献
工业废水和生活污水等的直接排放严重危害人类生命安全以及生态环境的保护,对废水进行成分以及含量的检测具有重要意义。常用的对水体中重金属元素检测的方法大多需要对样品进行复杂的预处理,检测效率低,不能多元素同时分析,因此,亟需发展一种实时、原位、可以进行多元素分析的方法。激光诱导击穿光谱技术(Laser-induced breakdown spectroscopy,LIBS)是一种具有快速、实时、无需样
随着云服务的发展,用户的需求日益增多,微服务体系架构成为了当今企业解决单体应用模式的主要方案,其将一个大型的单一应用程序和服务划分为几十上百个微服务。微服务系统架构中的各个部分责任明确,调用关系复杂,故障发生时,准确定位故障服务节点有助于排查系统故障原因。由于微服务系统的故障通常是由于内存利用率、CPU利用率等关键性能指标发生异常导致的,因此想要对微服务系统的故障进行检测,需要在定位微服务系统发生
随着科技的不断发展,无人机逐渐成为生活中常用的电子设备,其充电主要通过传统蓄电池供电方式,需要在地面上对蓄电池进行充电,因此在偏远山区进行作业时其续航能力成为难点。微波无线输能(MPT:Microwave Power Transmission)技术利用微波在空间中传输功率,可以为无人机持续供电。整个系统包括发射、传输和接收三部分,发射部分作为系统的微波源,为终端提供功率能量,传输部分是空间中微波的
传统的单体应用架构因具有部署容易、测试方便的特点被广泛运用,然而随着业务需求的增长和互联网技术的发展,单体应用逐渐出现部署效率低下、扩展性差、技术迭代困难等问题。微服务技术以其松耦合、高扩展性的特性解决了单体应用架构的困境,微服务架构根据项目的业务逻辑将其拆分为多个服务,每个服务被独立部署,都拥有独立职能,各自完成独立的功能逻辑,无需关注其他服务的开发,提升了开发效率。在微服务架构背景下,用户发出
随着互联网与计算机科学技术的高速发展,运用软件系统来解决复杂实际问题的场景越来越丰富。然而随着业务访问量的不断增大,软件系统的负荷不断加重,性能不断下降,迫切需要提升软件系统的性能以适应更多的应用场景。软件系统的性能很大程度上取决于其本身的参数配置,很多组织依靠聘请专家来配置参数,费用往往十分昂贵;并且随着软件系统规模和复杂性的不断增大,传统人工优化参数越来越困难,如何实现自动优化软件系统参数配置
步行作为最基本的出行方式,具有减碳和促进居民健康双重积极意义。本文聚焦于人体如何感知步行舒适度这一基础的研究议题。通过对北京市中心城区交通情况的分析,本文发现北京步行交通的需求正在不断提升。随后本文使用citespace软件对国内外城市可步行性领域的文献进行总体分析,发现在微观层面对步行过程中人体感知的研究文献总量有限。基于分析结果,本文从视觉感知、听觉感知、嗅觉感知和热感知入手,详细归纳总结在步
随着军事科技的发展和深空探测活动的不断开展,卫星作为探索太空的必要航天器,更容易受到强电磁脉冲武器的威胁,其中太阳能电池作为卫星中重要的供电组件,对卫星平稳安全的运行起到了不可或缺的作用。同时,由于小型卫星上有限的载荷空间和载重,很难安装大型反射器,所以可利用太阳能电池作为反射阵天线的阵列平面。因此,在强电磁脉冲武器的打击下,探究太阳能电池单元及用于反射阵天线的集成电池单元的耦合机理尤为重要。本文
巴伦作为一种不平衡-平衡转换器,被广泛应用在天线、推挽放大器和倍频器的差分馈电和阻抗匹配上。随着通信技术的迅速发展,巴伦的高功率、超宽带和小型化等特性成为微波器件领域亟待解决的热点问题。不同于集总元件式巴伦和微带线式巴伦,同轴巴伦采用功率容量较大的同轴线为功率载体,具有更好的高功率处理能力,同轴线的宽带特性有利于巴伦的超宽带和小型化设计。因此,同轴巴伦的研究对高功率宽带巴伦领域具有十分重要的意义。
随着社会逐步走向科技化与智能化,计算机视觉技术也迎来了前所未有的发展热潮。为了进一步理解视觉世界,研究者不再局限于像目标检测这样简单的场景识别任务,而是转向对复杂场景中各种视觉关系的理解。在多种视觉关系中,人和物体的交互关系最能体现一个场景中的主题。本文主要着眼于视频中的人物交互识别任务,相比于图像人物交互检测,视频任务的关注要点从空间关系转移到了时空关系上。目前的视频人物交互识别算法大多使用实例
目的:探索血肿周围1cm区域内的Tmax值与高血压性脑出血肢体运动功能预后的相关性。方法:收集资料:收集2020-12-31至2022-01-31期间在第二附属医院就诊的符合纳入标准的45例高血压性脑出血患者,记录一般资料(性别、年龄等)、影像学资料(CT、CTP、CTA),CTP资料包括:感兴趣区域血肿区(A区)、血肿周围1cm范围内区域(B区)、B区健侧半球镜影区(B1区)的CBF、CBV、T