基于单目视觉SLAM的三维场景实时重建

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：pilot111

【摘要】

：

三维场景重建广泛地应用在移动机器人、无人机、无人驾驶、增强现实和虚拟现实等领域,有着重要的科研价值和应用意义。通过视觉同步定位与地图创建(SLAM)来进行三维场景重建

【作者】

：

孙玉柱

【出处】

：

上海交通大学

【发表日期】

：

2004年期

【关键词】

：

单目视觉同步定位与地图创建闭环检测三维场景重建深度图

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

三维场景重建广泛地应用在移动机器人、无人机、无人驾驶、增强现实和虚拟现实等领域,有着重要的科研价值和应用意义。通过视觉同步定位与地图创建(SLAM)来进行三维场景重建的研究主要是:基于递归的贝叶斯概率估计理论的方法;基于关键帧和光束平差法捆绑调整的方法;基于图优化的方法。在基于单目视觉时主要有三大类困难:基于特征点的方法会牵涉到提取和匹配特征点时造成计算量大、精度低、无法准确描述场景等问题;单目视觉固有的尺度模糊性、无法直接获取目标物体的深度、长时间运动后会有大的尺度漂移;实际场景中存在着相似物、遮挡、运动物体等干扰,景深变化剧烈并且多闭环等情况。本文基于这三大类困难,对基于单目视觉SLAM的三维场景重建的算法和系统实现进行了深入的研究。本文在传统的基于特征点的方案上使用改进的特征描述符使得系统的鲁棒性和持续跟踪能力有了明显的改善。在改进的系统框架中:通过引入图像金字塔和加权的高斯牛顿优化方法使得算法的实时性比较理想;通过先在局部进行半稠密的深度图的传播和更新来形成局部地图,然后剔除非必须关键帧并经过拟合后融入到全局地图中,使得系统准确性和实时性都有所改善;通过结合Chow-Liu树算法和词袋模型先构建词汇树来获取外观特征概率分布,然后计算当前场景和所有特征在先前场景中的概率和匹配相似度来形成累积匹配序列并进行场景相似性计算,使得闭环检测得到实现;通过增加一个尺度自由度并结合图优化方法使得系统的精确性和尺度适应性有了进一步提高,整个系统框架通过三个线程来实时实现。最后通过实验和其他算法对比表明,本文方法取得了比较满意的准确性、鲁棒性、实时性和灵活性。

其他文献

演讲视频幻灯片切换检测研究

目前,随着科技的发展和普及,学习形式也越来越多样化。在线学习已经成为了一种重要的学习方式,并且每天都有大量的学习视频上传到网上。演讲视频是其中一种非常重要的学习资料,但是这些视频都未结构化,如果用户想要了解演讲视频中某个具体的知识点,他们往往要浏览整个视频才能找到。这种学习方式会大大降低学习者的学习效率。因此,很有必要利用演讲视频摘要技术自动化地提取演讲视频中代表性的知识信息。目前,很大一部分录制

学位

演讲视频幻灯片切换特征点稀疏时变图深度学习

陕西旬阳烂木沟金矿控矿构造与矿床成因

烂木沟金矿床位于秦岭造山带南秦岭构造亚带碌曲—旬阳印支褶皱带中段,属秦岭板块南秦岭逆冲推覆系构造岩片。前人对烂木沟地区以西成矿带金矿地质特征、控矿因素、矿床成因的研究较多,观点各异,但对烂木沟地区的研究较少,缺乏系统分析。本文综合分析了区域成矿背景,对烂木沟金矿床进行了详细解剖。通过对矿区地质调查、薄片显微观察、矿床地球化学及同位素年代学等方面的研究,查明了矿体分布特征、矿区控矿构造、可能的成矿物

学位

控矿构造矿床成因烂木沟金矿旬阳

长江流域极端降水的时空特征及其区域频率分析

在气候变暖的大背景下,多数陆地地区的极端气候事件频率和强度都呈现上升趋势,研究长江流域极端降水的时空变化特征及区域频率,可以为流域内的防洪减灾工作提供参考。本文基

学位

极端降水趋势分析区域频率时空特征长江流域

基于布谷鸟搜索算法的位势和弹性力学反问题

力学反问题具有广泛的工程背景和学术价值。力学反问题主要包括确定未知物性参数、识别边界几何形状、求解未知边界条件和缺陷检测等几种反问题。这几类问题一般是不满足适定

学位

反问题边界条件参数识别布谷鸟算法边界元法

光正交频分复用在中短距离低成本应用场景中的关键技术研究

正交频分复用（OFDM）技术自上世纪六十年代诞生于美国贝尔实验室,现已广泛运用于有线和无线通信中并成为了长期演进技术升级版（LTE-A）的标准。而将OFDM技术运用于光网络,并得益于

学位

OFDMPAPR接收机灵敏度相干接收机

联络口译中译员的信息把关人角色

联络口译是应用最为广泛的一种口译形式,与会议口译相比,联络口译正式性相对较低,因此也更为灵活。在联络口译过程中,译员处理信息时往往会发挥自身主观能动性。然而,在口译实践中,译员可能会质疑这一做法是否符合译员职业道德。产生质疑的原因在于,传统的译员角色要求译员遵守绝对忠实的原则。而随着口译相关研究的发展,译员逐渐找到了自身作为“人”而非“机器”的角色。在这些角色当中,基于传播学“把关人”理论而出现的

学位

联络口译译员角色信息把关人

基于局部模式的人脸识别研究

随着现代计算机视觉技术的不断发展和硬件计算能力的不断提高,人脸识别相比于指纹识别等其他生物特征识别技术,由于其非侵扰、高效率、友好性等诸多优势,已广泛应用于电子商

学位

人脸识别高斯差分(DOG)金字塔均衡局部模式局部方向数局部图结构

基于商用WiFi精确CSI相位测量技术研究

WiFi技术得到广泛应用,除了作为方便的短距离无线通信方式,还可以用来实现神奇的无线感知。近年来,基于商用WiFi设备获取的信道状态信息(Channel State Information,CSI)的各

学位

信道状态信息非线性相位误差旋转相位误差CSI拼接商用WiFi

基于机器学习和遗传算法的SQL注入漏洞恶意数据自动化生成方法

近年来,SQL注入漏洞一直被国际OWASP(Open Web Application Security Project)组织列为Web应用高危安全漏洞之一。面向SQL注入漏洞检测的恶意数据生成成为学术界和产业界研究

学位

SQL注入漏洞恶意数据生成机器学习遗传算法

可解释深度学习中高维概率分布转换算法研究

当下,深度学习可解释性是最前沿且重要的科研难题之一。可解释深度学习中许多问题都可以归结为高维概率分布转换,如工程中应用广泛的生成模型、领域自适应等。目前可以计算高

学位

可解释深度学习高维概率分布转换切片最优传输并行

基于单目视觉SLAM的三维场景实时重建

其他学术论文