基于生成对抗网络的无监督视觉里程计算法研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:gsy2589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉里程计(Visual Odometry,VO)是从连续的图像序列中估计相机自运动的一种计算机视觉技术,它可以恢复相机的6自由度(6-Do F)相对位姿。随着深度学习的快速发展,基于卷积神经网络的视觉里程计在无人驾驶和机器人视觉导航等方面都获得了令人满意的性能。考虑到有监督的深度学习方法其性能依赖于大量且高质量的标注数据,而在实际应用中往往难以获得这类大量且高质量的标注数据。因此,本文围绕无监督视觉里程计方法开展研究。无监督视觉里程计方法是利用图像相邻帧之间的亮度一致性约束。然而场景中的非刚性运动和遮挡都会导致这个约束条件不成立,从而造成相机位姿估计误差。并且这个误差会随着时间进行累计,进而导致视觉里程计中的漂移问题。本文针对上述问题,提出一种基于刚性感知和生成对抗网络的无监督视觉里程计方法,它可以有效地提高相机位姿的估计精度,从而减少累计误差。本文的主要工作如下:(1)第三章提出了一种基于光流-深度-位姿联合学习的无监督视觉里程计方法。为了提高相机位姿的估计精度,本文结合光流法和由粗到细(coarse to fine)的思想,设计了一种融合光流运动特征的精确相机位姿估计模型,即Flow-Pose Module(FPM)。它可以让神经网络充分利用光流和相机位姿之间的内在联系来加强对相机位姿的学习能力。进而提出了一种FPM的迭代优化策略,它是基于相机位姿解耦的相机姿态估计结构,并通过循环单元FPM迭代更新相机位姿。在每次的迭代更新中,它会根据先前估计的相机位姿学习到一个残差的相机位姿,并生成一个精度更高的相机位姿估计。(2)第四章针对在动态场景中非刚性运动和遮挡对视觉里程计的影响,本文在第三章的基础上提出了一种基于刚性感知和生成对抗网络的无监督视觉里程计框架。该框架包含了一个刚性感知生成器和一个刚性掩码判别器。通过充分利用生成对抗网络的训练机制,它结合了像素级和结构级的刚性感知,然后用于提高相机位姿估计。最后,为了证明所提出网络模型的性能,在KITTI数据集上对所提的算法模型进行了训练和测试。并且通过与其他视觉里程计算法的结果对比表明,所提的算法模型具有一定的有效性。
其他文献
随着互联网的发展,网络社交媒体上的不实信息传播愈加猖獗,如何快速找到匿名不实信息的真实作者成为亟待解决的问题。寻找匿名作者的工作被研究人员分为作者验证和作者识别两个任务,前者判断两个匿名文本的作者是否为同一个,后者从备选作者中找出匿名文本的真实作者。本文主要研究作者验证问题,在作者验证的基础上通过匹配算法进行作者识别问题的研究。传统的基于机器学习的作者验证和识别方法多针对论文、书籍等长文本,可以从
学位
目的:观察妊娠期糖尿病采用参芪降糖胶囊治疗的临床效果。方法:选取2020年8月—2022年8月我院收治的86例妊娠期糖尿病患者作为研究对象,应用单双号分组法分为对比组和观察组,每组43例。对比组、观察组分别应用常规治疗、常规治疗联合参芪降糖胶囊,将二者疗效实施对照分析。结果:观察组治疗后各项血糖指标、母婴结局、临床疗效均优于对比组(P<0.05)。结论:用参芪降糖胶囊对妊娠期糖尿病实施临床治疗,可
期刊
以糯米粉为原料或辅料的淀粉基食品在生产、加工过程中常会出现干硬、脱水、品质下降等问题,因此不同的食品添加剂或其它食品组分比如蛋白质等被用于糯米食品的生产加工中,用以改善产品的品质特性及感官特性。然而,针对糯米这一加工方法,尚缺乏直接的研究结果弄清糊化过程中大米蛋白及蛋白质酶解物与糯米淀粉的相互作用机理,特别是淀粉与蛋白质的主要结合力类型及两者互作对淀粉消化性的影响还有待阐释。本课题着眼于糯米糊化过
学位
随着信息和数字化媒体技术的飞速发展,人们对视觉内容服务的需求快速增长。光场(Light Field,LF)作为一种新兴的视觉媒体,可以在视觉上为用户带来良好的浸入感和临在感,目前已广泛应用于计算机视觉领域,如三维重建,虚拟现实和深度估计等。然而在光场图像不同阶段的处理过程中,会不可避免的发生失真效应从而导致图像质量的恶化。为了指导和监管光场图像的获取,处理及应用,设计与人类视觉系统(Human V
学位
聚羟基脂肪酸酯(Polyhydroxyalkanoates,PHAs)是一类生物制备型的绿色环保可降解塑料,具有与传统石油基塑料(如聚丙烯)类似的材料学性质,是理想的传统塑料替代品。利用微生物发酵合成PHAs是目前工业规模化生产PHAs的主流,但高昂的发酵生产成本问题一直限制了PHAs的广泛应用。因此,本论文选择廉价、来源广泛、可再生的原料作为PHAs合成发酵碳源,利用嗜盐微生物的高盐生长优势采用
学位
科学技术的发展、经济的进步促使了移动通信技术的蓬勃发展。过去的四十年间从1G的诞生到5G投入商用,移动通信技术逐渐融入到了人们的生活中。与5G通信系统相比,6G通信系统有高速率、低时延、高频谱效率等优势,但5G研究时期提出的新型多载波技术对于6G仍适用。在提出的多种新型多载波技术中,通用型滤波器组多载波(Universal Filtered Multi-Carrier,UFMC)被认为是一种能够替
学位
大黄鱼肉质细嫩,色味俱佳,富含营养,在我国具有较大的市场。大黄鱼的水分含量较高,在运输、储藏过程中由于微生物和酶的影响,容易腐败,从而造成大量的经济损失,因此开展大黄鱼的保鲜技术研究尤为重要。涂膜保鲜是近年来备受关注的一种保鲜技术,将天然高分子和天然抑菌剂进行混合制备涂膜保鲜材料是常见的研究方向。但是随着保鲜时间的延长,天然抑菌剂会逐渐消失,特别是精油类具有挥发性的天然抑菌剂,因此将天然高分子和天
学位
医学影像的出现提高了临床诊断准确性和便捷性。然而,单一传感器获得的影像存在局限性,通过将多传感器互补得到信息更为完整的影像成为目前医学诊断的研究方向。针对现有的多模态医学图像融合算法存在图像信息提取能力不足和图像特征整合效果欠佳的问题,本文提出了两种有效的多模态医学图像融合新方法。具体内容如下:1、针对现有图像融合文献中对图像信息分类不够精细导致对图像细节处理能力不足的问题,本文提出基于人眼视觉特
学位
量子纠缠是一种重要的物理资源,它表现为多个量子系统之间非经典、非定域的强关联,在量子通信中有着广泛的应用。然而在实际使用过程中,量子纠缠态易被噪声(通常为白噪声)干扰从而变得可分离,因此寻找目标量子态的最小白噪声容限成为一个备受关注的课题。另外,关于纠缠态的可分性判定,对于两体系统已有了比较深入的研究,提出了部分转置正定(PPT)准则等一系列有效的判据。但对于多体纠缠(三个及以上量子系统的纠缠),
学位
微波输能技术具有损耗较低和功率容量大等优点,受到广泛关注和应用。为了减少无线设备的非自主电源的依赖性,以及客服环境中可收集的射频能量较为微弱的问题,本文对小型化、低功率输入下的2.4/5.8GHz微波整流电路展开了研究。前期通过学习整流电路的设计思路和方法,对不同的整流结构、整流二极管、板材对比分析,并使用ADS仿真软件对所提出的整流电路仿真验证。本文首先设计了一款基于5.8GHz微波频段的单频整
学位