基于深度学习的无人机视频目标跟踪算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wenlingqiang6268047
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科技的迅猛发展,无人机已被广泛应用于各个领域,包括军事侦察、物资派送、电力巡线、地质勘探和智能安防等。作为无人机应用的关键技术之一,目标跟踪技术已成为机器视觉领域的研究热点。在无人机航拍视频中,跟踪目标往往伴随着背景干扰、尺度变化、遮挡等复杂情况,因此,研究高效、鲁棒的目标跟踪算法对无人机的应用具有十分重要的意义。本论文研究基于深度学习的无人机视频目标跟踪算法,主要的研究工作如下:(1)针对无人机视频中小目标跟踪精度低的问题,提出一种基于自适应融合网络的无人机目标跟踪算法。首先,基于感受野模块和残差网络(Residual Network,ResNet)构建深度网络模型,有效提取目标特征并增强特征的有效感受野;然后,提出一种多尺度自适应融合网络,能够自适应地融合网络的深层特征和浅层特征,增强特征的表达能力;最后,将融合后的特征输入到相关滤波模型中,计算出响应图的最大置信分数,从而确定跟踪目标位置。实验结果表明,该算法在跟踪成功率和精确率上均达到了较高水平,有效提升了无人机目标跟踪算法性能。(2)针对无人机飞行过程中,目标易发生尺度变化、形变等问题,提出一种基于Siamese网络的尺度自适应无人机目标跟踪算法。首先,结合跨阶段局部网络和深度可分离卷积的优点构建深度网络模型提取目标特征,优化了网络结构,减少了网络模型计算量;其次,将提取的目标模板特征与搜索区域特征进行互相关卷积操作,得到特征响应图;最后,设计一种基于无锚框的分类与回归网络,计算响应图中跟踪目标的位置。实验结果表明,该算法能够有效降低目标尺度变化、形变对跟踪性能的影响。(3)针对无人机多目标跟踪中小目标难以识别和多个目标聚集遮挡时难以精准匹配的问题,提出一种基于全尺度表观特征的无人机多目标跟踪算法。首先,基于YOLOv4网络模型构建了一个多尺度目标检测器,增强对目标的检测能力,为后续的跟踪匹配提供数据保障;然后,构建一种全尺度网络模型用以提取目标表观特征,增强对同类物体的辨识度。同时,利用卡尔曼滤波器对目标的运动状态进行预测;最后,联合目标表观特征和运动信息,利用基于匈牙利算法的目标匹配策略实现检测结果与跟踪轨迹的匹配关联,完成多目标跟踪任务。实验结果表明,该算法有效增强了特征对小目标的表达能力,具有较好的跟踪性能。
其他文献
多动症作为儿童时期最为常见的神经发育障碍疾病,其康复方式分为院内康复和家庭康复。而多动症患病儿童及其家长受到学业、工作、社会舆论、医疗资源等多方面因素的影响,多选择药物治疗为主,家庭康复训练为辅的治疗方案。调研发现,目前多动症家庭康复仍存在康复服务延续性差、专业性不足、训练数据结果不直观、产品适用性低、趣味性不够等问题。本研究针对这些问题,运用服务设计思维,提出了依托于医院的家庭康复服务模式,并结
学位
热固性高分子材料由于其永久性的交联点使其具有优异的稳定性和热机械性能,广泛地应用于结构材料、涂料、粘合剂等领域。从本质上来讲,永久性交联点的存在也使得热固性材料回收困难,无法再次利用,造成了资源浪费和环境污染。动态共价聚合物网络(DCPN)的出现,可在减少热固性高分子材料造成环境污染中发挥重要作用。它既保留了热固性材料的优异性能又可以在某些刺激下像热塑性塑料那般可重复加工使用。近年来,动态共价键及
学位
荧光高分子水凝胶是具有可调发光性能的高分子软材料,既具有高分子水凝胶的“软湿”特性和丰富的刺激响应行为,又具有荧光的灵敏度高、应用广泛的特点,在智能显示、仿生软体驱动器和信息防伪加密方面有广阔的应用前景。目前,制备荧光高分子水凝胶常用的方法主要为通过物理或化学的方法向水凝胶基质中引入有机荧光团、镧系配合物、发光纳米粒子等。然而,如何在一个水凝胶体系中引入不同荧光发色团实现全光谱荧光发射,且具备智能
学位
每一个芬斯勒度量可以诱导一个流形上的喷射.在流形上给定一个体积形式,又可以给出射影喷射的概念.我们称射影喷射的Ricci曲率为射影Ricci曲率.在芬斯勒几何中,(α,β)度量是一类特殊的芬斯勒度量.它具有如下形式:F=αφ(s),s=β/α,其中α=(?)是黎曼度量,β=bi(x)yi是1-形式,φ=φ(s)是开区间(-b0,b0)上的正的光滑函数.本文研究的是一类比较特殊的(α,β)度量,φ(
学位
垂直腔面发射激光器(VCSEL)具有阈值电流低、光电转换效率高、耗能少、易与光纤耦合等优点,在光通讯、高密度光存储、激光显示、激光打印、激光照明等领域都具有巨大的应用潜力。近年来,随着氮化物材料外延技术的发展,氮化镓(GaN)基VCSEL受到人们的普遍关注。但器件的制备还普遍存在一些问题:由于该器件结构中布拉格反射器(DBR)不导电,环形的电极导致电流限制不足及载流子传输效果差,降低了GaN VC
学位
大气污染已成为影响城市公共健康的重要问题之一。城市中大气污染物主要来自能源、工业、居住和交通等方面,随着城市化进程加快,能源和交通排放激增,城市大气污染日趋严峻。城市形态是指城市实体的空间构成,展现了城市内部的空间布局与外观特征,已有研究表明污染物的扩散分布会受到城市形态的影响。因此,明确对大气污染物扩散影响显著的城市形态参数,分析各形态参数的影响趋势至关重要。目前,城市形态与空气质量的相关性研究
学位
在21世纪的今天,人们对健康问题越发重视,细菌感染问题已成为人们关注的重点问题。目前细菌感染尤其是手术后引发的感染给病人的身心造成极大的影响,而抗生素的大量使用不可避免会引发耐药菌风险,所以亟需开发新型抗菌剂。众所周知,铜是一种长期应用的广谱杀菌剂,被大量应用在抗菌不锈钢、涂层等领域。但铜往往需要相对较高的浓度才能具备杀菌性能,这可能会导致细胞毒性。本研究前期发现当Cu2+被还原为Cu+时能极大提
学位
显示技术作为重要人机交互界面之一,在快速发展的信息时代中起着举足轻重的作用。现代高分辨率显示屏幕主要采用了有源矩阵平面显示技术(AMFPD),其可以在一帧时间内保持恒定发光,具有低功耗、使用寿命长等特点。AMFPD通常采用薄膜晶体管(TFT)作为像素的开关/驱动元件,而高性能显示技术追求更高的分辨率和更快的刷新频率。因此,对TFT的迁移率提出了更高的要求。非晶氧化铟基TFT具有高场效应迁移率、可低
学位
装配是工业生产中的一个重要环节,工业机器人广泛应用于自动装配领域,而轴孔装配是其中一种典型的装配任务。本文针对轴孔装配任务,为避免卡阻发生,提出了基于视觉和力反馈的主动柔顺装配方法,该方法根据视觉和力信息进行寻孔,根据力反馈完成插孔装配。本文首先对寻孔策略和插孔策略进行了理论分析。设计了视觉定位系统中的图像识别算法,并进行了孔识别的实验,此外还介绍了机械臂的手眼标定原理并进行了标定实验,最终实现了
学位
生物质是一种天然可再生的有机碳资源,将其转化为平台化学品能促进可再生资源的有效利用并提高其附加值。5-羟甲基糠醛(HMF)被认为是一种重要的平台化合物,可通过氧化、还原、醚化、胺化和异构化等转化为多种高附加值化学品。2,5-呋喃二甲醇二烷基醚(BAMF),可作为优秀的生物基燃料与燃油添加剂,将来有望替代传统的石油燃料。BAMF可以通过HMF先加氢还原成2,5-呋喃二甲醇(BHMF)后,再与醇类醚化
学位