基于深度U型网络和Transformer的遥感图像工厂提取研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:simuwuzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感图像工厂提取作为计算机视觉领域中新兴的热点研究课题,不仅在学术上推动了建筑物提取和道路检测等遥感领域的理论研究,而且在工程应用上为城市规划管理、土地利用和地图更新等系统提供了技术支持。随着深度学习的快速发展,遥感图像的目标提取任务取得了突破性的进展,但其算法在工厂这一类别上由于特定的诸多挑战依旧难以发挥优越的性能,例如工厂外观上存在颜色、纹理、尺度的巨大差异性以及遮挡、阴影等挑战。另外,高分辨率遥感影像相比自然场景图像包含了大量的背景信息,从而导致工厂提取具有严重的相似干扰问题。因此,针对上述问题,本文围绕门控网络和多尺度特征的鲁棒学习展开研究,基于UNet和Transformer网络给出两种不同的工厂目标提取算法,并在两个公开的数据集上验证了其优异的性能。本文主要包含以下研究成果:第一,构建了第一个大规模的遥感图像工厂提取数据集。本文在中国的15座城市收集了4395张工厂图像,涵盖了各种复杂的场景以及各种类型的工厂。所有图像均采用手工标注,经过反复核查保证数据标注的质量,并使用多种评价指标全面的评估相关算法的性能。第二,给出了基于深度U型门控网络的遥感图像工厂提取方法。现有的工厂提取方法主要通过引入辅助信息和构造新型的特征融合方式实现精准的目标分割。然而,这些方法没有提取充足的全局上下文信息,导致工厂定位不准确。为了解决上述问题,本文设计一种U型模块,该模块能够在不降低空间分辨率的情况下,增加网络的深度,提取目标的深层语义信息,并通过U型模块的叠加构造新型骨干网络。另外,本文给出一种门控模型,旨在缩小编-解码特征之间的语义鸿沟,自适应融合多尺度特征。整体结构采用多监督的形式,最大限度的训练每个U型模块。本方法在遥感图像工厂提取数据集上进行实验并取得较优的分割准确度。第三,给出了基于Transformer门控网络的遥感图像工厂提取方法。在工厂提取任务中如何获取具有判别力的全局信息是提高工厂定位能力的关键因素。受Transformer等工作的启发,本文利用Swin Transformer捕获长距离依赖关系,获取全局上下文信息,并设计一个对称的解码网络充分利用全局-局部信息恢复图像细节。考虑到仅结合相同阶段的编码特征难以提供充足的细节信息,同时为解码网络带来噪声干扰,降低特征质量。本文设计一种门控引导模块,引入全局信息做指导,选择性地获取可靠特征,优化多尺度特征表示。最后,本文引入边缘损失函数,解决工厂边界模糊的问题。本工作在FE4395等数据集上进行实验获得了最优的分割结果。
其他文献
作为一种新型的软件架构风格,微服务以其可维护性高、可伸缩性强和发布周期短等优点受到了越来越多研究人员的关注和公司的应用。然而,微服务给软件项目带来优势的同时,也在应用过程中迎来了相关挑战,这些挑战主要分为技术和开发组织两方面。本文将主要聚焦于解决开发组织方面的挑战,目标是明确微服务的应用对开发组织带来了哪些影响,公司如何确定其开发组织是否适应微服务开发以及如何对开发组织进行调整以提高对微服务的适应
学位
显著性目标检测就是从图像数据中找出最吸引人的部分,这部分区域被称为显著性区域。当下的一些显著性目标检测算法对于特征信息的利用不充分,使得最终训练得到的模型在鲁棒性和泛化能力方面较差。许多显著性算法都是针对可见光图像的,但是当可见光图像受到阴霾、光照等因素影响的时候,使用热红外图像效果可能更好。考虑到热红外相机在这些因素下受到的影响相对较小,本文针对RGB-T图像进行显著性检测研究,通过结合可见光图
学位
指静脉识别技术凭借其采集方便、安全性高、实时性好、活体检测等优点受到国内外研究团队广泛关注。近年来,指静脉识别领域已经取得了阶段性进展,但在实际应用时,仍遇到了许多问题:(1)受采集技术和采集装置的制约,所捕获的指静脉图像噪声多、清晰度差、对比度低、存在小范围的位移和旋转、类内样本图像之间差异较大;(2)传统指静脉图像特征提取算法对图像质量要求高,对光照变化和位移旋转敏感。因此,本文围绕指静脉图像
学位
近些年,基于单目图像的三维人体关节点估计引起学者们的广泛关注,可应用于视频监控、行为识别、三维建模、人机交互等多个领域。但是其存在较多的研究难点,例如输入图像的暗光、模糊、遮挡,以及由二维数据重建三维结构的歧义性问题等。因此,本文研究由单目序列图像估计中间帧三维人体关节点的方法,主要包括两个阶段:首先利用二维人体关节点估计算法预测序列图像的二维人体关节点位置,然后以此作为输入数据回归中间帧的三维人
学位
人脸检索旨在从人脸图像数据库中找到与查询图像最为相似的人脸图像,是计算机视觉领域广受关注的课题之一。随着移动互联网的发展,人脸图像规模呈指数级上升,这对人脸检索的存储空间和检索时间有着很高的要求。由于哈希码存储空间小、检索时间快,研究人员将哈希技术用于人脸信息存储和检索工作。但由于人脸图像受光照、表情、视角、年龄等多种因素影响,难以获得“类内高内聚,类间高可分”的哈希编码。本文针对此问题,给出两种
学位
在智能交通管理中,对于车辆的身份识别离不开车牌检测技术的支撑,目前基于深度学习的车牌检测研究已经日臻完善,但是对于大型车辆而言,容易受监控视角和车身污渍等影响导致车牌检测算法难以获得车辆身份信息。根据道路安全法的相关规定,大型车辆需要在车尾区域喷涂非标车牌,于是本文通过研究非标车牌检测来解决上述问题。与标准车牌相比,非标车牌存在字符间隔大、成像质量差和背景复杂等挑战,加大了非标车牌检测任务的难度。
学位
近些年来深度学习发展迅速,在不同领域都有着广泛的应用,尤其是图像分类方面效果显著,其中基于深度学习方法挖掘图像的显著性特征,在此基础上训练网络分类模型是其关键步骤之一。卷积神经网络(Convolutional Neural Network,简称CNN)是当前深度学习研究中最有效和常用的技术之一,可以自动进行图像特征的抽取,其参数共享和连接稀疏性的机制相比传统的神经网络不仅参数更少,效果也更加显著,
学位
随着互联网和移动终端设备的快速发展,越来越多的用户数据被推荐系统用来提高推荐的性能,准确性和多样性成为衡量推荐效果的两个重要指标。然而,这两个指标是相互冲突的,很难同时优化两者。一个通用的做法就是应用多目标进化算法,以平衡两个目标间的冲突。但多目标推荐过程中,用户需要将自己的原始数据发送给不可信的第三方服务器,这会造成严重的隐私泄露。差分隐私是近些年来非常流行的推荐系统隐私保护方法,但目前缺少多目
学位
学位
多肽是一种天然存在的物质,大小从2到50个氨基酸不等。自20世纪胰岛素疗法出现以来,肽疗法在医学实践中发挥了显著的作用。与传统的药物相比,他们具有几个优点:易于合成、毒性低、较高的靶向特异性和选择性。癌症和病毒感染一直是导致死亡的主要原因,对人类健康有很大的影响,也是发达国家和发展中国家关心的健康问题。传统的癌症治疗方法依赖于放疗和化疗,这也给患者带来了严重的副作用。作为一种治疗肽,抗癌肽(ACP
学位