基于卷积神经网络的可见光遥感影像船只目标检测研究

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:lqy760305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在光学遥感背景下,舰船目标检测一直是计算机视觉研究的热点。近几年,随着海洋监测技术的不断发展,舰船检测成为海洋监测的重要内容。在打击走私、海洋运输等领域发挥着关键作用。但是,目前的检测手段很难同时满足到对舰船目标进行精确、有效地旋转探测。光学遥感影像中的舰船目标尺度分布是非常广泛的,而任意排列的舰船目标都必须通过严格的旋转框来进行定位,从而让舰船目标的检测在光学遥感领域中极具棘手。针对舰船在光学遥感场景下旋转检测问题,本文提出了一种能够有效、准确地探测其目标的整体检测框架。论文的主要工作及创新之处包含以下几部分内容:(1)针对复杂背景下的光学卫星图像,本文基于yolov5算法设计了一种单阶段舰船旋转检测框架,R-yolov5。其对舰船检测转换成对目标的中心坐标、宽度、高度、旋转角进行分析。在推理部分,本文设计了一种Soft-Rotate-NMS新方法,用于对旋转舰船目标检测算法R-yolov5中的旋转框进行冗过滤。实验结果证明:R-yolov5算法在HRSC2016数据集上AP可以达到89.84%,AR可以达到85.47%,FPS可以达到每秒43帧;在DOTA数据集上AP可以达到84.25%,AR可以达到79.96%。其算法保证检测精度和检测效率之间取得良好的一致性。(2)针对大尺度光学遥感图像中舰船目标检测,基于Anchor的目标检测算法,增加了模型的复杂度,从而影响模型对舰船目标在实际场景应用中的检测速度。为了设计一种高效的大尺度检测框架,本文在R-yolov5算法的基础上设计出了一种Anchor-Free单阶段旋转目标检测算法,RAF-yolov5。不同于R-yolov5算法,不会在特征图上设置几组通过聚类算法得到的不同长宽比的先验框Anchor,有效的降低了模型的复杂度;同时设计了解耦头预测器,将类别信息和边界框定位信息进行分离学习,从而更有效的学习其特征信息。实验结果证明:RAF-yolov5算法在HRSC2016数据集上AP可以达到91.42%,AP可以达到86.50%,FPS可以达到每秒28帧;在DOTA数据集上AP可以达到85.83%,AR可以达到80.91%。其算法在没有降低模型精度的条件下,所设计的检测器对舰船目标的旋转检测到达了更有效的推理检测,验证了其检测的有效性。(3)为了解决遥感场景图像中相似舰船目标对模型学习舰船目标的干扰问题,本文提出了一种基于RAF-yolov5算法的双分支骨干网络检测算法,RAF2-yolov5。用于在含有类似目标物体的遥感影像中更好的检测出目标物体。该方法会使用两条特征提取器共同作为RAF2-yolov5算法的骨干网络对可见光遥感舰船图像进行有效的学习,从而很好的区别开舰船目标与相似物体之间的特征信息。同时为了让模型能够模拟人类眼睛的自动注意力,在观察大量事物时,自动的锁定感兴趣的事物,过滤掉其他事物的重要程度,本文在RAF2-yolov5的骨干网络中引入通道注意力机制EACNet模块,让模型更专注于学习图像中的舰船目标区域信息,有助于提高模型的鲁棒性。实验结果证明:RAF2-yolov5算法在HRSC2016数据集上AP可以达到93.58%,AR可以达到88.64%,FPS可以达到每秒21帧;在DOT A数据集上AP可以达到88.79%,AR可以达到82.35%。所提出的RAF2-yolov5方法可以有效地抑制可见光遥感影像中相似物体对舰船检测的干扰,降低了模型的错检率。
其他文献
知识分子是一种对社会和文化具有重要意义的角色,肩负着价值维系者与伦理代言人的重要角色,文明正是因为有了这样的“社会良心”才得以延续。知识分子不仅在八十年代改革开放的语境中成为了时代的弄潮儿,在电影叙事中也占据着重要的地位,知识分子作为创作者、电影人物、时代主体,产生了一种三位一体的密切联结,形成了一整套以知识分子叙事为核心的电影话语。本选题的研究所要解决的问题是:在八十年代的中国电影之中,影片创作
学位
碳量子点(CDs)作为一种直径小于10 nm的球形新型荧光纳米发光材料,与其它量子点相比具有优异的光学性质、易于官能化和制备、良好的水溶性、低毒性、表面容易修饰等诸多优点,在很多领域有广泛的应用,成为了近年来纳米材料研究的热点。但是,环境生物样品的复杂化,对CDs的灵敏度,特异性和准确性有着越来越高的要求,在分析应用中面临很多的挑战,量子产率低,表面基团的缺乏,荧光强度受干扰因素多,导致对目标检测
学位
彩票假设指出在一个随机初始化的稠密网络中存在能够被独立训练的稀疏子网络(彩票网络),且这样的子网络能够达到与原网络一致的性能。然而,先前的大量研究将网络的性能等同为其在测试集上的准确率。但准确率远非唯一的衡量指标,有时甚至可能不是最重要的。因此即使彩票网络能够维持原网络的准确率,仍可能存在未知的特性损失,无法直接用彩票网络替代原稠密网络。此外,彩票网络的搜索过程需要反复进行训练和剪枝操作,本身消耗
学位
本翻译实践报告从信息检索角度着手,借助信息检索工具和信息检索方法,以探讨信息检索在翻译实践中的具体应用,重点关注翻译传播媒介类文本过程中,信息检索的重要性和各种信息检索方法的应用。针对传播媒介类文本中的翻译重难点,本实践报告运用信息检索工具,将信息检索方法分为两大类展开运用。一类是基于不同应用场景的信息检索,包括搜索引擎检索、文献数据库检索和电子词典检索;一类是基于不同策略的信息检索,包括布尔逻辑
学位
CeO2是一种典型的稀土金属氧化物,属于萤石结构,呈现出良好的氧化还原性能,作为研磨材料,其抛光性能好,研磨效率高,粉末颗粒莫氏硬度适中,因此受到人们的广泛关注。传统的CeO2抛光粉已经不能满足一些超精密零件的抛光要求,众多研究结果表明,向CeO2中掺杂非金属元素F、Si可以改变其颗粒形貌和团聚状态等,会影响其抛光活性,从而提高其抛光性能。为进一步研究F、Si掺杂对CeO2抛光性能的影响,本文采用
学位
城市轨道交通给人们带来便利、缓解城市交通拥堵的同时,噪声污染也随之而来。新时期轨道交通的发展必须满足绿色、环保、智能、可持续等社会经济发展理念,因此,在快速发展过程中的安全性、舒适性、环保性以及可靠性等方面的要求也会不断提高。由于地形的限制,大跨度高架桥梁线路形式在轨道交通中应用较为广泛,车致交通噪声问题尤为突出,有必要对城市大跨度轨道斜拉桥车致交通噪声进行系统性的研究。城市交通噪声主要来源于公路
学位
党的十九大报告明确指出:“坚持法治国家、法治政府和法治社会一体化建设。”这为中国特色社会主义法治道路的发展指明了新的方向,标志着全面依法治国进入了新的发展阶段。新时代的大学生作为中国特色社会主义现代化建设的主力军,只有具备完善的法治意识,才能更好地投身于中国特色社会主义法治建设当中。因此,加强新时代大学生法治意识培育工作,提高新时代大学生法治意识水平是适应时代变化发展的必然要求,具有重要意义。本文
学位
经典成核理论和两步成核理论是研究者们用来解释晶体成核过程的理论基础,一直受到研究者们的广泛关注。MOF的成核生长机理自其诞生以来也充满争议。原位液相透射电镜技术为晶体成核研究提供了直观可视化的技术手段。对于原位液相透射电镜技术的发展也不仅只局限于晶体成核生长研究,随着微加工工艺的发展,原位液相电化学体系得到了越来越多的关注。本文利用原位液相透射电镜技术研究了金属纳米粒子和MOF的成核过程,并进一步
学位
网络直播是近年来伴随着互联网技术兴起逐渐发展出的一种全新的传播形态,它的出现不仅改变了传统单一且局限的社交方式,而且创造了一个全新的网络交往场域,建立了跨越时间和空间的网络化社会关系。与传统社区式交往以及其他社交媒介交往方式相比,网络直播为用户在传播空间和社会关系建构方面都带来了全方位的改变。本研究摆脱了以经验猜测洞察用户的局限性,目的是在互联网人口红利逐渐消退的情况下,为目前市场上的网络直播应用
学位
河湖范围不清、管理失效是目前水域生态空间亟需解决的两大难题。流域系统治理与生态空间分区管理是提升江河湖泊生态保护治理能力、维护河湖健康生命的关键。河湖健康与岸线及其功能分区的科学划定和管控举措的实施密切相关。国外关于与河湖生态空间相关的研究主要集中在水资源、水环境、水生态和河岸带管理层面,而国内河湖生态空间的研究尚处于起步阶段,迫切需要对空间划定方法及保护策略展开研究。论文首先通过系统梳理国内外与
学位