单目实时深度估计与三维重建

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liongliong442
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维重建技术是计算机视觉和图形学的重要研究课题,被广泛运用在虚拟现实,增强现实,非物质文化遗产保护和影视游戏等诸多领域。基于单目相机的三维重建的流程整体上可以分为两个模块:一是计算全局稳定一致的相机姿态,二是稠密恢复点云、融合全局模型。基于图像特征点法的相机姿态估计,在特征点提取模块将引入大量的计算,稠密深度图估计往往也需要付出较高的运算代价。本文将主要专注于三维重建中的上述两个模块。本文的三维重建系统中的相机姿态估计模块采用稳定鲁棒的同时定位和地图构建系统——ORB-SLAM。为了充分利用GPU资源,本文改进了 ORB-SLAM的特征点提取模块,提高了特征点检测速度,实现了一种基于GPU的ORB分块提取,且在GPU上最大化并行构建四叉树用于快速筛选图像特征点,使得特征点结果集在图像上分布更均匀。这样的特征点提取方法增强了相机姿态跟踪的鲁棒性,降低了轨迹绝对误差。该模块的挑战在于充分利用GPU资源,快速构建四叉树。传统的建树方法必须自顶向下逐层构建各个节点,我们实现了最大化并行构建二元基数树的每个节点,并能转化为四叉树、八叉树和KD树等其他树型结构。在深度估计模块,首先在ORB-SLAM关键帧缓冲池中选取合适的参考帧并结合当前关键帧进行稠密深度图恢复。我们采用基于局部的双视图深度估计方法,利用GPU快速恢复稠密深度图并恢复点云,最后根据关键帧的位姿和深度信息进行完整场景重建。我们的特征点提取方法相比于原始的ORB特征点提取方法,应用在SLAM系统中降低了姿态估计误差,提高了系统鲁棒性。与ORB-SLAM系统中的特征点提取方法相比,我们的方法在不同参数下获得了不同程度的速度提升。我们的深度估计算法可以实时恢复单目图像深度图,结合ORB-SLAM系统估计出的相机位姿和关键帧可以较好的恢复出场景的三维模型。
其他文献
枣专家在对枣果实进行研究时,对枣果实品质判定是一项重要的研究课题,判定结果具有重要的实际意义,不仅为该品种枣果实的销售方向、选育品种、合理补充营养等提供理论研究依据,还
本文在分析变压器振动噪声对我国电网影响的基础上,对变压器振动和噪声在线监测技术进行了研究,开发了一套基于Web的变压器振动噪声在线监测系统。系统集成了Client/Server和Browser/Server两种模式,配合相应的硬件采集设备,实现了对变压器运行过程中振动噪声等信号的远程采集、监测和处理。系统以SQLServer 2000作为数据库平台,采用Windows Socket通信技术进行数据
用传统的Job-Shop方法进行调度时,是把产品的加工过程分为加工与装配两个相互独立的过程,产品先进行加工,待所有部件都加工完毕,再进行产品的装配。因此这些方法只适用于解决大批量,品种单一的产品调度。当有小批量且品种多样的产品时,采用传统Job-Shop的方法进行调度必然会导致加工时间的加大,产品的生产效率降低。因此这些方法不适用于解决此类调度问题。因此对复杂产品综合调度问题的研究具有理论价值和实
随着无线通信技术的不断发展与进步,各种无线通信系统在人们实际生产生活中的应用也变得越来越广泛,让我们的生产变得更加高效,生活也变得更加丰富。无线通信系统中信号的正常接
作为图像处理和图像分析在生物特征认证领域最成功的应用之一,自动人脸识别(Automatic Face Recognition, AFR)最近几年来成为研究热点,受到广大学者的特别关注。自动人脸识
网络教育是远程教育的一种形式,是指计算机网络、卫星通信网络和电信网络为介质,在以多媒体网络课程为核心的学习资源构建的网络教育环境中展开教学与学习活动进程的教育组成
在空间数据库中,反向最近邻查询技术是最重要的查询技术之一,它是在最近邻查询技术的基础上提出的,反向最近邻查询技术是空间数据库技术研究的重点和难点,如何有效地实现反向
“题意描述不清”是程序设计试题中备受关注的议题。比如概念二义性,概念实例丢失,试题语义完整性不易判别等。针对这一问题,提出了基于本体的题目语义表达的研究方法,将本体
计算机技术和数字通信技术的飞速发展改变了传统信息领域的很多方面,20世纪90年代中期,国内外兴起了建设数字化图书馆的热潮。图书和档案都是信息资源的重要组成部分,在信息
本文研究了复杂未知环境下多机器人地图构建的问题,首先,提出了一种基于粒子群优化算法进行全局优化,以及对目标区域进行希尔伯特曲线探测的多机器人协作构建地图的方法。并