基于深度学习的航拍图像检测算法研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:hanyi1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机具有拍摄范围广、灵活性强以及成本低等优点,在运动物体的检测与跟踪、特殊环境下的搜索和救援以及智能交通系统的构建等方面具有重要的意义。由于无人机拍摄视角和高度,以及目标存在尺寸较小、尺度多变等问题,导致通用场景下的检测算法效果差。因此,研究快速、准确的无人机图像目标检测方法是无人机视觉领域的重要课题。本文的具体研究内容如下:首先,综述目标检测的发展历程,包括以手工设计特征为代表的传统目标检测方法和基于深度学习的目标检测方法,以及航拍图像数据集的发展现状;回顾深度学习的发展历程和经典的检测算法,阐述深度学习中的卷积神经网络(CNN)的理论基础、实现原理和目标检测算法的优缺点总结;从近年来快速发展的经典算法包括以YOLO系列和SSD、DSSD的一阶段(one-stage)目标检测算法和以R-CNN为代表的二阶段(two-stage)检测算法进行原理介绍。其次,针对传统的目标检测不能及时准确的响应复杂多变的航拍场景,本文选择深度卷积神经网络方法对目标进行特征提取,以性能良好的Cascade R-CNN框架为基准,在经典的深度残差网络的基础上,设计注意力机制的残差网络模块,加强目标的特征提取能力;由于最近邻插值的上采样方法较难捕捉邻域的像素变化,且不能学习多尺度的特征,本文以经典的特征金字塔结构为基础,引入轻量型的基于内容感知的特征融合方式,具有自适应感受野的优点以加强目标特征的融合;同时,选择Relu激活函数,构建快速高效的车辆检测模型。为加强算法检测的鲁棒性,本文从图像翻转、平移、亮度变化、随机裁剪等进行数据增强,以及多尺度训练策略方面进行优化和改进。最后,本文构建以公开数据集Vis Drone为基础,结合实际场景下的无人机航拍图像数据集,验证改进后的车辆检测与识别算法,最终使航拍图像检测的TOP-5精度比Cascade R-CNN提高了1.2%,APm,APl分别提升了2.1%和3.8%,在行人、汽车等类别精度分别提升了2.6%和1.0%,测试数据表明改进后的模型有效的改善了误检、漏检现象,有效提高了检测类别的置信度。该改进方法具有较强的实时检测能力,具有一定的实际应用开发价值。
其他文献
磁性液体是由磁性纳米颗粒、表面活性剂及基载液三种物质组成的胶体悬浮液,它兼具液体材料的流动性和固体材料的磁性,其在磁场作用下呈现的非接触式可控特性广泛受到了科研工作者的关注。同时,磁驱动作为一种具有远程、非接触、实时控制、瞬时响应、无特定环境要求且与生物医学具有较好的兼容性等优点的操控方式,在生物、化学、医学、光学、微流控、机械等领域中具有良好的应用前景。但由于磁场作用下的磁性液体流体动力学行为异
学位
随着通信技术的高速发展,互联网逐渐成为各种信息的载体。旅游门户网站也成为了游客发表旅游景点评论的主要平台,网站中的信息成为众多旅游者参考的重要依据。因此,如何从游客的评论中挖掘出关键信息,从而识别出情感倾向,以便提升游客服务质量,具有重要的意义。传统的情感分析方法过度依赖人工构建的情感词典和人工选择特征,这会花费巨大的人力物力。为了提高模型精度,提升工作效率,本文基于深度学习的方法在甘肃省的6个5
学位
时空序列数据指的是数据既随时间发生改变也在空间上呈现一定分布,以空气质量数据为例,一个地区的所有空气质量监测站点记录的数据就构成一组时空序列数据。直接对时空序列数据建模预测不仅可以更好地提取数据在时间和空间上的相关关系,而且相比于针对各空间节点单独构建时间序列预测模型可以降低模型的参数和训练时间。本文主要以甘肃省的PM2.5数据为例设计了一个时空序列预测模型,并针对数据特点对模型做出了改进。本文利
学位
在信息过载时代,推荐系统通过挖掘用户兴趣为用户过滤冗余信息,使得用户能在推荐结果中快速检索其意向商品。协同过滤是工业界中影响最深远的推荐算法之一,它通过用户、商品之间的相似关系进行推荐。如何在协同过滤思路上进一步提升推荐质量是推荐系统中的热门问题。近年来,图神经网络协同过滤方法快速发展,为推荐算法提供了一个新思路。这类算法将用户与商品之间的交互历史重构成图结构数据,再利用图卷积结构挖掘用户与商品之
学位
在汽车电气化发展的趋势下,锂离子电池被广泛地用作新能源汽车的动力电源,但较高的能量密度可能会导致其火灾安全性较低。就目前的技术而言,锂离子电池仍然有无法避免的“热失控”风险,电池火灾安全问题已经在相当程度上制约了电动汽车的发展。电池包灭火系统的冷却性能是保障电池包火灾安全性的关键,但是在面临环境或电池本身的不确定性因素影响下,该性能的表现会发生变化,导致系统可能无法满足灭火冷却的需求。因此,确保灭
学位
函数型数据分类研究是函数型数据分析中十分重要的研究方向,已被广泛应用于生命科学、医学与经济学等领域中.常见的函数型数据分类方法大多只给出一个分类结果,其不足之处在于无法量化结果的不确定性.一致性预测是量化预测不确定性的常用方法,其目的是通过预测区间(回归问题)或集合(分类问题)消除预测结果的不确定性.本文基于一致性预测方法,提出一种新的函数型数据分类算法.该算法能构造出满足给定覆盖率的预测集合,以
学位
谐振式MEMS陀螺基于科里奥利效应实现惯性测量工作,但限于目前的生产加工水平,陀螺结构的精度较低,从而影响陀螺的测量精度,通过激光修调系统可改善陀螺的机械结构,其中模态频率作为激光修调系统中陀螺最重要的性能参数,需要更快的速度来实现检测,从而提高整个激光修调系统的工作效率。本文以提高谐振式MEMS陀螺的模态频率检测速度为目的,重点对模态频率快速检测系统进行研究,分别对陀螺的驱动控制、梳齿位移信号检
学位
随着经济全球化和信息技术的高速发展,制造执行系统(manufacturing execution system,MES)已成为现代制造控制管理系统中不可或缺的环节。它将制造企业的计划层管理系统与车间现场设备有效联系起来,使车间所存在的信息孤岛得以消除,目前已在钢铁、汽车、通信设备等行业得到广泛使用。本论文以“某知名医疗器械生产企业”作为研究对象,该医疗设备企业产品具有多批次、多种类、小批量的特点,
学位
湖泊是十分重要的自然资源,其对区域气候具有调节作用,能够反映区域环境的变化,并且具有维持区域生态系统平衡和繁衍生物多样性的特殊功能。湖泊对气候变化的响应较为敏感,研究其对气候变化的响应是一项重要的课题。本文以我国最大的内陆湖——青海湖为研究对象,利用历史湖泊表面水温以及相关气象变量对青海湖夏季湖泊表面水温进行预测研究。由于青海湖湖泊表面水温存在大量缺失值,本文首先采用了六种不同的缺失值填补方法生成
学位
智慧教育需要在非接触条件下感知精神压力过大的学生,过大的精神压力对人体危害极大,需要及时干预。非接触式光电容积脉搏波描记法(Remote Photo-plethysmography,rPPG)是通过摄像机来获取心动周期造成的肉眼看不见的周期性细微皮肤颜色变化从而提取脉搏波的技术,具有无感、快速和成本低等优点,本文的研究目的是基于rPPG技术使用面部视频进行精神压力识别。首先,建立了rPPG样本集。
学位