轻量级单目深度估计算法及其实现研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lck2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从单目图像中恢复出场景的深度信息,即单目深度估计,一直是视觉领域中重要的研究问题。单目深度估计被广泛地应用在自动驾驶、无人机和机器人等诸多领域,嵌入式计算平台上的单目深度估计也逐渐成为亟需研究的课题。现阶段大部分深度估计算法依赖于高性能的服务器等计算平台;少部分深度估计算法可以在嵌入式计算平台实时地预测深度信息,但是其精度还未能满足嵌入式设备的需求。此外,现有的深度估计算法很多忽略了平衡精度和延迟,以及适配不同嵌入式设备上不同硬件体系结构的问题。针对以上这些挑战,本文主要研究内容与贡献如下:(1)针对嵌入式设备上轻量级的单目深度估计算法精度受限这一问题,本文以大幅度提高精度为目标,首先设计了编码器——解码器算法DEM(depth estimation model,DEM)。DEM基于双路径神经网络,其编码器缓解了现有编码器不能同时重用特征和重探索特征的缺陷;解码器缓解了现有解码器不能有效学习局部特征的缺陷,DEM从而提高了单目深度估计的精度。为使DEM的精度进一步提高,本文提出了基于相对深度关系的损失函数指导DEM的训练。之后,本文基于现有的编译方法在嵌入式TX2的图形处理单元(graphics processing unit,GPU)计算平台上加速DEM算法,同时不改变其精度。在DEM算法的基础上,本文提出了只使用单目相机进行室内外场景重建的即时定位与建图系统(Simultaneous localization and mapping,SLAM),旨在缓解单目SLAM中的尺度模糊问题,验证单目深度估计DEM在场景重建中的准确度。本文提出的SLAM系统,包括8个模块:DEM、特征检测、描述子计算、特征匹配、位姿预测、关键帧提取、回环检测和位姿图优化,每一模块均可以灵活地被替换。大量的实验验证了所提出的DEM提高了深度估计的精度;训练DEM的损失函数相比其他损失函数至少将精度提高了0.8%;DEM的优化在不改变其精度的情况下,使嵌入式GPU计算平台上的单目深度估计的推理延迟、CPU(central processing unit)/GPU占用率、功耗、能耗分别降低了10.8%、4.8%、1.3%、2.9%、13.9%(使用NYU-Depth-v2测试数据集评估);基于DEM的SLAM系统更准确地重建了室内外场景;DEM在雷达超分辨率中的应用相比其他方法的精度至少提高了14.5%。(2)针对嵌入式平台上单目深度估计计算资源开销严格受限的挑战,本文以大幅度减少中央处理器(central processing unit,CPU)上的计算资源开销为目标,首先设计了轻量级的编码器——解码器架构EDA(encoder and decoder architecture,EDA)。其次,本文使用深度学习编译器技术,在嵌入式的CPU计算平台上部署、编译和优化EDA,使EDA的推理延迟、内存占用率和CPU占用率降低,同时保持推理精度不变。此外,针对目前深度估计研究大多未使用真实场景的数据在嵌入式计算平台上进行深度估计,本文开发了在实际嵌入式计算平台和真实场景中进行快速单目深度估计的通用框架,并将深度估计算法融合到机器人操作系统(robot operating system,ROS)中,使深度估计发布器发布的深度信息供其他ROS节点使用,以使机器人更好地感知环境。通过实验验证,在实际嵌入式CPU计算平台上和场景中本文的方法取得了较好的结果。例如,优化后的EDA在TX2 CPU计算平台上,其CPU延迟、内存占用率、CPU占用率、功耗与流行的算法相比至少低了57.5%、16.1%、10.9%、34.9%;优化后的EDA的精度比其他算法至少高了0.4%(使用NYUDepth-v2测试数据集评估)。(3)为了平衡嵌入式计算平台上深度估计算法的计算复杂度和精度,本文首先设计了单目深度估计算法MDE(monocular depth estimation,MDE)。其次,本文根据嵌入式计算平台的计算资源可利用的情况,基于强化学习方法设计剪枝算法来自动调整MDE的计算复杂度。具体通过剪枝算法去除MDE冗余通道,使MDE自动达到目标剪枝率,从而降低计算复杂度到阈值状态。同时,本文设计强化学习的奖励函数使MDE自动降低计算复杂度时精度损失最少。此外,为在不同嵌入式设备的不同硬件体系结构上进行单目深度估计,本文使用编译优化方法使MDE在精度不变的情况下,适配不同的硬件体系结构,同时降低MDE的推理延迟和功耗而不损失其精度。经过大量实验验证:本文设计的MDE相比最流行的算法,取得了准确度和延迟之间的权衡;本文的剪枝方法降低了MDE的推理延迟、功耗和存储占用的空间;本文的编译优化方法使MDE适配了不同的硬件体系结构。例如,在嵌入式板子Nano上,输入为KITTI数据集上的228×912的RGB图像时,与流行的深度估计算法相比,经过剪枝和优化的MDE在Nano GPU嵌入式平台上,其延迟、准确度和功耗指标方面至少好了71.9%、10.9%、0.3%。其他视觉任务(例如像素级分割)也可借鉴以上平衡深度估计精度和计算复杂度、自动调整计算复杂度或适配不同硬件架构的方法,从而保证轻量级任务能够大规模地部署于不同嵌入式计算平台的不同硬件体系结构上。
其他文献
现代高速飞行器的姿态跟踪控制问题是目前飞行控制领域的研究热点。随着相关领域的快速发展,高速飞行器的飞行环境日趋复杂,飞行过程具有更强的非线性和不确定性,使得传统的控制方案很难实现满意的控制性能。同时,越来越多的新型飞行任务对飞控系统的综合控制性能提出了更高的要求:在复杂的飞行环境下,始终维持系统稳定的同时又能够更快更准地跟踪飞行姿态指令。为了应对这些新的挑战,本文针对现代高速飞行器再入飞行段的姿态
由于目前我国工程的管理水平较低、环境复杂度高、施工技术动态多变等特点,导致安全事故频发,高处坠落尤甚。事故发生后,调查组会以事故案例报告的形式记录事故的发生经过、原因、性质、应对措施等关键信息。事故案例报告中蕴含丰富的安全知识与专家经验,但是这些案例的重用率低,挖掘不充分。本文研究了2013-2019年239篇高处坠落事故案例,以期发现事故的致因和致因机理,为安全事故的科学防控提供指导。论文主要由
三维建筑物模型是虚拟地理环境中的主要元素之一,在三维导航、智慧城市和电脑游戏等领域都有广泛应用。随着倾斜摄影测量和三维激光雷达扫描等三维数据获取技术的快速发展,三维建筑物模型越来越真实,细节越来越丰富,数据量也越来越大。当前,三维GIS成为推进交通、电力和水利等各个行业信息化的重要技术手段。为了使用户能够与三维场景流畅交互,传统GIS系统都将模型数据提前存储在客户端以供渲染,但这种方式数据更新不便
碳中和债是在碳中和的大背景下应运而生的新品种,随着政策逐渐落地,碳中和债迎来了发展机遇,截至2021年末,碳中和债累计发行1807亿元,已成为绿色债券的重要组成部分。文章回顾了碳中和债一二级市场运行情况,并展望了其未来发展。
期刊
近年来,随着各类新技术在柴油机上应用,柴油机的强化程度随之提高,导致柴油机的热负荷和机械负荷急剧升高。活塞是柴油机的核心部件之一,承受着较高的热负荷,是最容易失效的零部件之一,因而需要对活塞采取足够的强化冷却,以确保其可靠性。为了提高某大型高功率密度船用柴油机的活塞冷却能力,本文搭建了活塞振荡实验台,基于可视化技术,研究了不同状态下大功率柴油机活塞冷却油腔内润滑油的振荡形态,揭示了活塞振荡冷却腔内
天地往返飞行器在航天和军事领域具有重要研究价值,通常涉及到飞行器的可重复使用性,这也创造了巨大的经济价值,因此它是各航天大国研究的重点之一。论文主要针对可重复使用的天地往返飞行器再入段的姿态控制及执行器复合控制分配问题开展研究。首先建立简化的飞行器再入段姿态系统的通用模型,再结合工程实际分析了飞行器装备的气动舵和尾部反作用控制系统(Reaction Control System,RCS)的物理特性
基于深度学习的人脸识别方法突破了多年来传统浅层方法的固有瓶颈,已经成为目前主流的技术手段。深度学习模型的成功,往往建立在大量有标记的样本参与训练的基础之上。然而,人工标注的成本极为高昂且对非相应领域专家来说有较高的操作难度,相比之下无标记的样本则显得容易获得。在这种背景下,本文提出了标签传播与主动学习结合的算法,同时考虑到算法中有标记样本和样本特征为增量式更新这一情况,将其与基于粒度的序贯三支决策
在Web GIS应用中,为了解决Web地图服务(Web Map Service,WMS)瓦片生成效率低下的问题,通常会采取预先离线生成瓦片数据的方式提高效率。然而,瓦片文件存在数量多,单幅地图0-18级瓦片文件的总数量近千亿;瓦片文件小,大部分瓦片大小在2KB以下;低信息密度瓦片大量重复等特点,使用本地文件系统如NTFS、EXT4进行存储时存在存储效率低下、读写性能恶化等问题。为解决瓦片文件存储的
软体机器人作为机器人领域的一个重要分支,相对比于刚性机器人有着不可或缺的作用和优势。软体机器人可以承受更大的冲击和变形,更加适用于非结构环境中,同时软体机器人具有较好的鲁棒性和安全性。本文基于软体材料,研制了纤维增强式仿人软体机械手。据统计,中国上肢残疾人数有将近40万人,而对于目前的商业假肢均为刚性手,所能实现的功能较为有限。人的肢体行为是由神经控制的,在肢体运动过程中会产生微弱的电信号,因此肌
为了更好地评价天基预警系统激光干扰效果,论文对其涉及的三个关键性问题展开了深入地研究:一是天基预警系统探测图像的仿真问题;二是复杂背景下红外弱小目标检测问题;三是天基预警系统激光干扰效果建模问题。针对第一个问题,研究的重点是尽可能的利用有限的资料数据来实现天基预警系统探测图像的仿真,论文以商用高分辨率卫星红外图像为基础,研究天基预警平台观测、传感器成像、目标弹道运动和辐射、激光干扰光斑仿真等模型,