基于卷积神经网络与注意力机制的遥感图像目标检测研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:skyisheaven1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉的基础任务之一,目标检测是对图像中感兴趣目标进行定位和分类。随着遥感技术的不断成熟,尽管遥感图像的数量呈爆炸式增长,但遥感图像的利用率还是很低,航天遥感数据的利用率小于5%,航空遥感数据的利用率小于10%。如何从海量的数据中得到有用的信息?因此需要迫切发展智能的图像理解和解译方法。遥感图像目标检测技术是遥感图像理解和解译的重要研究方向,在军用领域和民用领域有很大的应用价值。随着计算机技术的发展和深度学习理论不断完善,遥感图像目标检测技术在性能上有了巨大的提升。然而,由于遥感图像普遍存在目标分布不均匀小目标多,目标分布不规律呈密集分布,目标有不同朝向且背景环境复杂等特点,导致基于普通光学图像的目标检测方法在遥感图像中表现较差,因此针对遥感图像的具体特点研究高性能的目标检测模型已成为一种趋势。考虑上述遥感图像研究现状,本文针对遥感图像的特点,基于卷积神经网络目标检测理论和方法,着重解决遥感图像中的小目标,密集目标以及多朝向目标的检测问题。主要研究如下:(1)针对环境背景复杂且包含小目标的遥感图像难以进行精准目标检测的问题,提出基于注意力和特征融合的一阶段目标检测模型。该模型对一阶段目标检测模型SSD(Single Shot MultiBox Detector)进行改进,模型由检测分支SSD和注意力分支组成。首先,在检测分支SSD中加入注意力分支,注意力分支的全卷积网络通过逐像素回归得到待检测目标的位置特征;其次,采用对应元素相加的方法对检测分支和注意力分支进行特征融合,获得细节信息和语义信息更丰富的高质量特征图;最后,用软非极大值抑制进行后处理,进一步提高目标检测的准确性。实验结果表明,所提模型在遥感图像小目标检测中,检测精度和检测效率有明显提升。(2)针对现有目标检测模型在密集目标检测性能差的问题,提出了一种基于注意力与可变形卷积的遥感图像目标检测模型。该模型对两阶段目标检测模型的特征提取阶段进行改进。首先,设计特征金字塔模块,采用下采样和跳跃连接的方式融合多层特征,获得含有更多语义信息和细节信息的特征图。其次,采用注意力机制,设计注意力模块。注意力模块由多尺度位置注意力和卷积块注意力模块组成,它们通过施加权重的方式,自适应的强化位置区域特征和通道特征,减少无用信息的干扰。最后,引入可变形卷积模块,通过学习特征图中每个像素的偏移量,自适应的调整感受野,对形态大小不同的密集目标进行有效采样,进而提升检测精度。实验表明,所提模型的检测性能优于文中其它对比方法,能够很好地检测密集目标。(3)针对多朝向密集目标水平检测框重叠的问题,本章提出了一个有向边界框预测的遥感图像目标检测模型。该模型首先在RPN(Region Proposal Network)中加入角度信息,通过预测角度信息,实现有朝向目标的检测。其次,重新设置锚框大小,使其覆盖更多的遥感目标,并且改变传统水平边界框的交并比算法,提出新的适合于有向边界框的交并比算法。最终,输出的图像中含有向边界框,有向边界框含有较少的背景信息且很好的贴合待测目标。实验结果表明,相较于文中其它对比方法,所提模型能实现多朝向密集目标检测的同时,也具有较高的检测精度。
其他文献
<正>《3-6岁儿童学习与发展指南》(以下简称《指南》)中指出:"幼儿科学学习的核心是激发探究兴趣,体验探究过程,发展初步的探究能力。成人要善于发现和保护幼儿的好奇心,充分利用自然和实际生活机会,引导幼儿通过观察、比较、操作、实验等方法学会发现问题、分析问题和解决问题。"相比刚上幼儿园的时候,大班幼儿的求知欲和好奇心更为强烈,对身边事物的探究兴趣更为浓厚,也更乐于亲自去探索某些现象背后的科学原理。
期刊
量子信息处理是量子力学、数学、信息论等学科相结合的研究领域,其发展丰富了信息论等相关领域的研究内容.量子态的分辨和量子假设检验是量子信息处理中许多领域的基础.在量子假设检验中会产生两类误差概率,对称假设检验和非对称假设检验是处理这两类误差概率常用的方法.对称假设检验是对两类误差概率的加权平均和取最小;而非对称假设检验是对一类误差概率加以限制最小化另一类误差概率,相关的研究在其它领域也得到了很好的应
学位
粮食是人体的主要能量来源之一,它的储量和质量都关系着国家的发展和社会的稳定。粮食在储藏过程中常常因为霉菌、害虫等因素影响受到损害,会导致储粮的质量下降。粮食受损不仅会导致全球饥饿率的上升,而且长期食用被霉菌、害虫侵害的粮食会导致人类营养不良甚至诱发疾病。及时的检测和分离出受损粮食,不但可以减少储粮的损失,还可以避免人类产生疾病。因此,粮食质量检测工作是至关重要且刻不容缓的。本文的研究对象为发霉粒小
学位
量子资源理论对非经典的资源(比如:量子纠缠、量子相干、量子非马尔可夫等)提供了一个有效的理论框架.在量子信息处理中,纯态有非常好的应用,比如:量子隐形传态、超密编码、Shor算法以及HHL算法等.自然地,纯态可以看作是量子资源.量子纯度度量主要刻画量子态与完全混合态之间的偏差程度,定量量化纯度是量子信息理论中一个基本的问题.2003年Horodecki等人首次提出了纯度的概念,随后纯度得到了较为深
学位
兴趣点推荐系统在基于位置的服务中起着重要作用,旨在通过分析用户的历史或结合其他信息,在社交平台上向用户推荐其可能感兴趣的地点。但是,签到数据被暴露给不可信的推荐系统是一种隐私威胁,攻击者可能会根据签到数据推测出用户的一些个人信息,例如工作场所、宗教信仰和行为习惯等。因此,研究一种既能保护用户数据隐私,又能保证较高可用性的兴趣点推荐方法具有重要意义。基于扰动思想的差分隐私技术,能够提供防止隐私泄露的
学位
气候变化是全球变化最重要的表现之一,当前已涉及到人类的生存与发展。通过重建古气候变化,进而预测未来的气候变化规律一直是国内外研究的热点。中国第四纪黄土是研究古气候变化的良好载体,它记录了第四纪以来的气候冷暖交替,对于重建第四纪古气候变化具有重要意义。汉江上游位于秦岭南侧,大巴山以北,北亚热带季风气候边缘,对于气候变化异常敏感。区内峡谷盆地相间分布,受新构造运动和气候变化的影响,流域内分布不对称的四
学位
书法艺术是我国传统文化中的十大国粹之一,拥有极高的美学价值和文化意义。受书法作品保存条件限制和对书法学习的需求,将传统书法作品利用现代化技术进行数字化生成具有重要研究价值和研究意义。传统的字体生成方法大多基于人力进行手工绘制,过程复杂且受人为因素影响。随着深度学习的迅速发展和图像生成技术的不断改进,基于深度学习的字体生成方法受到广泛关注,并取得了一定的成果。但是现有方法多基于硬笔手写字体的生成,存
学位
随着全球经济发展与人类活动影响,大量新兴环境污染物(Contaminants of Emerging Concerns,CECs)经多种途径进入污水处理系统,其中药物与个人护理品(Pharmaceuticals and Personal Care Products,PPCPs)是最典型的 CECs 代表物,由于其较强的环境持久性和生物累积性,传统的污废水处理工艺很难将其去除,对自然环境和人类健康造
学位
计算机图形学算法通常被用在计算机上模拟三维的虚拟场景,为了模拟较好的三维场景,实现真实的光线效果,通常使用全局光照模型计算场景光照。全局光照算法作为计算机图形学的一个重要领域,多年来备受研究学者的关注。与传统的局部光照算法不同,全局光照算法除了计算场景中直接光线贡献的光强外,还考虑了由折射或反射产生的间接光线贡献的光强,所以全局光照会产生远高于局部光照的渲染绘制结果。光线跟踪是全局光照算法中最具代
学位
现如今,知识图谱(Knowledge Graph)已经成为大数据时代的重要工具,被广泛应用于下一代搜索引擎、智能问答和推荐等领域。基于知识图谱的问答一直是自然语言处理领域讨论的热门话题,由于自然语言处理技术日趋成熟和高质量通用领域知识图谱的相继出现,针对通用知识图谱的知识问答研究较多,且研究成果丰硕。目前,旅游领域已经出现了部分构建旅游知识图谱研究论文,甚至已经有公开的旅游知识图谱可供查阅。然而,
学位