【摘 要】
:
三维场景重建广泛地应用在移动机器人、无人机、无人驾驶、增强现实和虚拟现实等领域,有着重要的科研价值和应用意义。通过视觉同步定位与地图创建(SLAM)来进行三维场景重建
论文部分内容阅读
三维场景重建广泛地应用在移动机器人、无人机、无人驾驶、增强现实和虚拟现实等领域,有着重要的科研价值和应用意义。通过视觉同步定位与地图创建(SLAM)来进行三维场景重建的研究主要是:基于递归的贝叶斯概率估计理论的方法;基于关键帧和光束平差法捆绑调整的方法;基于图优化的方法。在基于单目视觉时主要有三大类困难:基于特征点的方法会牵涉到提取和匹配特征点时造成计算量大、精度低、无法准确描述场景等问题;单目视觉固有的尺度模糊性、无法直接获取目标物体的深度、长时间运动后会有大的尺度漂移;实际场景中存在着相似物、遮挡、运动物体等干扰,景深变化剧烈并且多闭环等情况。本文基于这三大类困难,对基于单目视觉SLAM的三维场景重建的算法和系统实现进行了深入的研究。本文在传统的基于特征点的方案上使用改进的特征描述符使得系统的鲁棒性和持续跟踪能力有了明显的改善。在改进的系统框架中:通过引入图像金字塔和加权的高斯牛顿优化方法使得算法的实时性比较理想;通过先在局部进行半稠密的深度图的传播和更新来形成局部地图,然后剔除非必须关键帧并经过拟合后融入到全局地图中,使得系统准确性和实时性都有所改善;通过结合Chow-Liu树算法和词袋模型先构建词汇树来获取外观特征概率分布,然后计算当前场景和所有特征在先前场景中的概率和匹配相似度来形成累积匹配序列并进行场景相似性计算,使得闭环检测得到实现;通过增加一个尺度自由度并结合图优化方法使得系统的精确性和尺度适应性有了进一步提高,整个系统框架通过三个线程来实时实现。最后通过实验和其他算法对比表明,本文方法取得了比较满意的准确性、鲁棒性、实时性和灵活性。
其他文献
目前,随着科技的发展和普及,学习形式也越来越多样化。在线学习已经成为了一种重要的学习方式,并且每天都有大量的学习视频上传到网上。演讲视频是其中一种非常重要的学习资料,但是这些视频都未结构化,如果用户想要了解演讲视频中某个具体的知识点,他们往往要浏览整个视频才能找到。这种学习方式会大大降低学习者的学习效率。因此,很有必要利用演讲视频摘要技术自动化地提取演讲视频中代表性的知识信息。目前,很大一部分录制
烂木沟金矿床位于秦岭造山带南秦岭构造亚带碌曲—旬阳印支褶皱带中段,属秦岭板块南秦岭逆冲推覆系构造岩片。前人对烂木沟地区以西成矿带金矿地质特征、控矿因素、矿床成因的研究较多,观点各异,但对烂木沟地区的研究较少,缺乏系统分析。本文综合分析了区域成矿背景,对烂木沟金矿床进行了详细解剖。通过对矿区地质调查、薄片显微观察、矿床地球化学及同位素年代学等方面的研究,查明了矿体分布特征、矿区控矿构造、可能的成矿物
在气候变暖的大背景下,多数陆地地区的极端气候事件频率和强度都呈现上升趋势,研究长江流域极端降水的时空变化特征及区域频率,可以为流域内的防洪减灾工作提供参考。本文基
力学反问题具有广泛的工程背景和学术价值。力学反问题主要包括确定未知物性参数、识别边界几何形状、求解未知边界条件和缺陷检测等几种反问题。这几类问题一般是不满足适定
正交频分复用(OFDM)技术自上世纪六十年代诞生于美国贝尔实验室,现已广泛运用于有线和无线通信中并成为了长期演进技术升级版(LTE-A)的标准。而将OFDM技术运用于光网络,并得益于
联络口译是应用最为广泛的一种口译形式,与会议口译相比,联络口译正式性相对较低,因此也更为灵活。在联络口译过程中,译员处理信息时往往会发挥自身主观能动性。然而,在口译实践中,译员可能会质疑这一做法是否符合译员职业道德。产生质疑的原因在于,传统的译员角色要求译员遵守绝对忠实的原则。而随着口译相关研究的发展,译员逐渐找到了自身作为“人”而非“机器”的角色。在这些角色当中,基于传播学“把关人”理论而出现的
随着现代计算机视觉技术的不断发展和硬件计算能力的不断提高,人脸识别相比于指纹识别等其他生物特征识别技术,由于其非侵扰、高效率、友好性等诸多优势,已广泛应用于电子商
WiFi技术得到广泛应用,除了作为方便的短距离无线通信方式,还可以用来实现神奇的无线感知。近年来,基于商用WiFi设备获取的信道状态信息(Channel State Information,CSI)的各
近年来,SQL注入漏洞一直被国际OWASP(Open Web Application Security Project)组织列为Web应用高危安全漏洞之一。面向SQL注入漏洞检测的恶意数据生成成为学术界和产业界研究
当下,深度学习可解释性是最前沿且重要的科研难题之一。可解释深度学习中许多问题都可以归结为高维概率分布转换,如工程中应用广泛的生成模型、领域自适应等。目前可以计算高