论文部分内容阅读
同时定位与建图(simultaneous localization and mapping,简称SLAM)技术一直是机器人和计算机视觉的研究热点,被广泛应用到无人驾驶,家用机器人等领域。以视觉传感器为核心的视觉SLAM技术,通过单目相机、双目相机或RGBD相机等视觉传感器感知周围环境,根据图像信息获取场景特征并估计自身位置,同时建立不同类型的环境地图。通过将视觉传感器安装在到移动机器人或者智能小车上,便于机器人进行陌生环境探索和开发,在智能驾驶、国防、救援、服务等领域都有越来越广泛的应用。本文以实现陌生环境条件下移动机器人环境感知、自身定位、场景重建为研究目标,将整个视觉SLAM系统分为视觉里程计,后端优化与回环检测三个模块。在视觉SLAM前端方案中,搭建基于Kinect的视觉SLAM算法研究平台,构建基于特征的视觉里程计算法,分析Kinect深度图像修复和ORB特征提取方法,通过特征提取和匹配估计相机位姿,此外重点分析基于图优化的后端优化算法,并提出基于深度学习的回环检测算法。在环境多变的复杂条件下,相比于卡尔曼滤波、扩展卡尔曼滤波等优化算法,基于图优化的算法具有更好的全局精度。回环检测是视觉SLAM的重要环节,回环检测通过地点识别的方法检测机器人曾经到访过的地方,并以此与历史数据相关联,增强约束,修复误差,使SLAM系统更加具有精确性和鲁棒性。相比于传统的回环检测方法,本文提出基于深度学习特征的地点识别算法,通过提取具有条件不变性的深度学习特征,在复杂多变的外在条件下,实现了更好的检测效果。论文主要工作和创新点包括:搭建了基于Kinect的视觉SLAM算法实验平台,通过空间滤波和滑动加权平均的方法修复Kinect深度图像,并在此基础上重点分析基于特征的视觉里程计模型,相比于SIFT和SUFT,采用了性能更好的ORB特征,通过特征提取和匹配方法得到特征匹配点对,采用图变换匹配方法进一步过滤错误匹配,减少误匹配,为得到更精确的位姿奠定了基础。讨论了卡尔曼滤波等基于滤波方法的后端优化方案,由于其具有一定的马尔科夫性,当前状态只与前一时刻状态相关联很难做到全局优化。针对这一问题,基于图优化的后端算法则是把位姿和路标等数据统一到非线性优化框架下,具有更好的全局优化精度,此外由于一个图像帧往往关联上百个路标点,路标点数量远大于位姿节点,增大了计算开销,在路标点相对稳定的情况下,采用位姿图优化方法可以提高后端优化的速度,在需要实时视觉SLAM的场合更加具有优势。回环检测是视觉SLAM的重要环节。在传统方法中常利用手工制作的特征来解决这个问题,随着深度学习的发展,研究者利用卷积特征进行闭环检测,并达到了更好的性能。在此基础上,本文进一步研究了卷积特征图的特性,提出了一种新的特征分析算法,其目的在于理解哪些特征图能够提取到关于图像内容和结构的信息,而这些信息对位置识别比较重要,哪些特征图可能只是外界环境的反映,在外界条件变化的情况下,这些特征图对地点识别将是干扰。此外,本文在具有挑战性的地点识别数据集上进行了相关实验,所提算法表现出更好的精度和性能。