【摘 要】
:
作为一种高机动性的飞行器,无人机在早期就被用于航拍、监控、搜救、农业灌溉等多个领域,近年来,随着人工智能的高速发展,在城市管理、智能交通、电力巡检等多个领域又备受关注。而场景语义理解与感知技术是无人机安全飞行与执行任务的关键,成为各界人士的研究热点与重点。本文结合语义分割、目标检测和深度估计与目标测距这三个子任务,设计了场景的多方面语义理解与感知方案。目前国内外研究人士对三个子任务的研究已经取得了
论文部分内容阅读
作为一种高机动性的飞行器,无人机在早期就被用于航拍、监控、搜救、农业灌溉等多个领域,近年来,随着人工智能的高速发展,在城市管理、智能交通、电力巡检等多个领域又备受关注。而场景语义理解与感知技术是无人机安全飞行与执行任务的关键,成为各界人士的研究热点与重点。本文结合语义分割、目标检测和深度估计与目标测距这三个子任务,设计了场景的多方面语义理解与感知方案。目前国内外研究人士对三个子任务的研究已经取得了不错的进展,但由于无人机场景的复杂性与特殊性,对此方面的研究仍然存在一些问题:1)目前的语义分割模型仍然存在边缘像素预测不准确问题;2)相比自然场景,无人机场景更加复杂,尺度变化大,小目标较多,而无论是语义分割还是目标检测,对小目标的精度普遍较低;3)深度估计方面,目前高精度标注的无人机场景深度估计与目标测距数据集极其缺乏;4)目前的目标测距算法普遍过程繁琐且实时性较差。通过对现有模型与问题的深入分析,本文展开了以下四个方面的研究工作:(1)为实现无人机场景的语义分割,针对边缘像素预测不准确问题,本文以Deep Labv3+模型为Baseline,结合了更换骨干网络、点渲染模块Point Rend等多种模型结构改进技术和指数滑动平均等多种训练优化策略对模型进行了改进。然后通过在UAVid数据集上的11组消融研究实验,验证了本文多项改进技术的有效性,相比原始模型,本文改进模型的m Io U提高了13.11%。最后从定量指标分析与可视化效果两个方面进行了模型的纵向和横向对比实验,验证了本文模型在边缘像素预测上的有效性与精确性。(2)为实现无人机场景的目标检测,针对小目标检测效果较差的问题,本文在YOLOv5s模型的基础上,添加了一个额外的小目标检测头来提高对小目标的检测精度(称为YOLOv5s_P2),并结合Vari Focal Loss和Label Smoothing等多项训练优化策略进一步改进。为了最大程度的提高模型精度,引入了基于目标密度图的图像裁剪算法。然后通过在Vis Drone 2021-DET数据集上的6组消融研究实验,从定量指标分析角度验证了本文多项改进技术对小目标检测的有效性,并从可视化角度验证了模型对多种复杂场景的检测能力。相比原始模型,本文改进的YOLOv5s_P2模型不仅提高了10.8%的m AP,还具有196 FPS的高实时性。最后进行了模型的横向对比实验,验证了模型的精确性。(3)为实现无人机场景的目标测距,本文摒弃了目前目标测距算法的两阶段繁琐过程,通过在YOLOv5s_P2检测模型的基础上增加一个距离预测的输出通道,设计了一个端到端的实时目标测距模型,不仅结构简单,且保持了较高的实时性。为填补无人机场景目标测距数据集的空白,本文提出了基于逆透视变换的目标测距数据集制作方法,不仅适用于无人机场景,也适用于无人车场景。同时,为了提高模型的测距精度,设计了一个特殊的损失函数来提高模型的学习能力。最后在制作的3个目标测距数据集上做了9组实验,从定量误差分析和可视化效果两个方面充分验证了本文的测距模型及数据集制作方法的有效性与准确性。(4)本文融合了以上三项工作的结果对场景进行了融合感知实验,真正实现了无人机对场景的多方面语义理解与感知。
其他文献
随着电子信息技术的发展,表面贴装技术(Surface Mount Technology,SMT)产线已处于智能化、数字化转型的关键阶段。传统的SMT生产制造系统缺乏与物理产线的关联融合,对生产活动的预见性不足,难以满足产线智能化生产的需求。数字孪生作为实现生产智能化的有效手段,能够满足产线生产资源可视化监控、生产过程实时分析和优化指导。本文通过设计SMT产线数字孪生系统总体架构,研究数字孪生数据处
液压管路系统是飞机安全运行过程中关键组成部分。现代飞机逐渐朝着系统高压化、结构布局复杂化发展,其振动问题也显得尤为突出。但是当前对管路结构振动问题的研究大都针对管路系统中较为特定的单一管路,缺乏对于管路系统中复杂多分支、多管并联和多管混联管路的动力学分析及结构强度评估的通用化方法。鉴于此,本文基于参数化思想,利用ANSYS软件的APDL、CFX的CCL和CEL语言建立了复杂液压管路CAE模型和多工
数字化检测旨在通过测量设备如三坐标测量机、激光测量仪、光学扫描仪等采集待检工件表面的点云数据,获取工件的实际加工尺寸,然后与设计模型比对确定加工质量是否满足设计要求。传统的数字化检测需检测人员手动在点云数据生成的网格模型上测量、人工查询设计图纸或三维模型进行实测值与设计值比对,检测效率低,针对这一问题本文提出了一种基于三维模型的工件加工质量快速检测方法,其基本思想是:以工件的三维设计模型及其产品制
空间可展开结构作为航天器的重要组成部分,已广泛应用于空间通信、对地观测、卫星导航及深空探测等领域。随着航天技术的发展,各种航天任务对可展开结构的形面精度提出了更高的要求。为提高有限元模型的预测精度,准确预测可展开结构的力学性能,从而快速实现可展开结构的形面调整,本文对可展开结构的不确定性模型修正和形面调整问题进行了研究,具体内容及成果如下:(1)为准确预测结构的力学特性,使仿真结果精确逼近试验结果
语义分割旨将场景图像解析为一系列连贯的语义区域,以实现对场景中所有元素的精确分割与识别,在无人驾驶、医学诊断等领域具有重要的意义。目前,基于可见光(Red-Greed-Blue,RGB)单模态图像语义分割方法已经取得了显著的进展。然而,此类算法容易受环境、光照变化的影响,具有较低的鲁棒性。与可见光图像不同,热红外(Thermal,T)图像在不同光照和天气条件下均能够稳定地反映温度高于绝对零度的物体
随着现代科技与工业的发展,旋转部件的转速不断提高,为旋转部件上的电路供电成为了难题。传统接触式汇流环等有线供电方式,普遍存在易磨损、有接触火花等问题,已无法满足高速旋转部件工作场景的要求。现阶段无线传能技术发展迅速,可以弥补传统有线供电方式的各种不足,具有智能便捷、可靠安全、维护成本低等优点,相关技术产品也成功得到应用,展示了其广阔的应用前景。本文从无线传能技术基础理论出发,针对旋转部件测量系统供
受人眼视觉注意机制启发,显著性目标检测旨在分割出自然图像中最具视觉吸引力的目标或区域,以快速准确地获取对图像的视觉理解。作为视觉场景理解中至关重要且极具挑战性的技术,显著性目标检测在图像描述、对象检测、语义分割、视频摘要等领域具有广泛的应用前景。近年来,得益于深度卷积神经网络强大的特征表征能力,基于深度卷积神经网络的显著性目标检测得到了快速发展,在一些简单场景下取得了令人满意的检测效果。然而,对于
无人机因为其适应性强、成本低(相较于有人机)、效费比高等特点,在民用、军用领域扮演着越来越重要的角色。现有无人机的导航方案基本是全球卫星导航系统(Global Navigation Satellite System,GNSS)配合惯性导航系统(Inertial Navigation System,INS)进行导航作业。但是,无人机在复杂环境下,如山区地形遮挡,战场电子干扰等,其导航所依赖的GNSS
空间可展开结构向着轻量化、大型化的方向发展,薄膜可展开结构以其质量轻、展收比大等优势,已成为大型空间可展开结构的重要实现手段之一。薄膜可展开结构在航空航天、公共建筑等领域得到了广泛的应用,具有较高的研究价值。本文以薄膜可展开结构为研究对象,首先,建立了一种基于伊卡洛斯(Ikaros)折纸的平面正多边形薄膜的折展模型,其次,基于剪式铰设计了空间伞状旋转抛物面可展开结构,最后,分析了在轨工况下平面周边
多智能体系统是由两个或多个智能程度较低的个体构成的复杂智能系统,利用局部信息交互在同一个环境中联合协作实现统一的任务目标,从而解决单一智能体难以或不可能解决的问题。其中协同跟踪问题是多智能体控制领域中研究的热点问题。然而常见的协同跟踪控制是一个渐近稳定的过程,系统输出无法完全收敛于期望轨迹。因此,本文利用迭代学习控制方法对协同跟踪问题展开研究,并针对多智能体存在初态偏差以及不确定性干扰的问题,设计