论文部分内容阅读
SLAM(Simultaneous Localization And Mapping),即即时定位与地图构建技术是全自主机器人、无人驾驶、自主无人机、AR等领域的关键技术,常用的SLAM传感器有激光雷达、单目、双目、RGB-D等传感器。单目相机由于其价格低廉、便于携带、信息丰富、易于与其他信息融合等优点,因此,单目SLAM是视觉SLAM研究领域中的热点也是难点。此外,RGB-D相机在室内比较稳定并且能够构建出稠密地图,在室内RGB-D SLAM有一定的研究价值。在实际应用中,例如通常无人机的飞行通过GPS进行定位,其定位精度较差且在室内、隧道、洞穴、山谷等场景下会失效,且一般通过人工控制进行避障,不能够自主进行对环境的感知与避障。为了克服上述不足,本文研究了单目SLAM算法,并将其运用于无人机采集的视频序列当中,对无人机的自主飞行提供了一定的理论基础。RGB-D相机由于其深度信息容易获得,易于搭建SLAM矿建,本文利用RGB-D相机数据集进行了SLAM系统的设计与实验,为后期系统的完善提供了大体框架,以进行开发与拓展。完善的SLAM系统包括前端里程计、后端优化、建图与回环检测四个部分。文中对SLAM系统的基本原理进行了较为深入地分析,从前端设计、后端优化、回环检测与建图四个方面进行了数学原理的推导与程序的设计。在前端设计中,单目SLAM利用对极几何计算了本质矩阵E和单应性矩阵H,并分解这两个矩阵,经过验证之后得到正确的位姿,然后利用该位姿进行三角测量得到地图点的三维坐标,再利用PnP的方法解算后续的位姿与地图点,RGB-D相机的前端设计中则直接用PnP进行位姿估计与地图点的求解,在基于直接法的前端设计中,则是利用最小化光度误差(Photometric Error)进行迭代求解位姿与地图点;进行后端优化时,利用Ceres库与G2O库通过高斯牛顿、列文伯格——马库尔特等算法来进行迭代优化,得到优化后的相机位姿与地图点;建图部分则分别利用ORB-SLAM2、LSD-SLAM和RGB-D数据建立稀疏地图、稠密地图与占据栅格地图,根据地图形式可达到进行定位、导航与避障等功能;回环检测中利用基于机器学习中非监督学习的方法来检测已出现的图像,并构造了基于ORB特征训练的字典,然后进行了词带模型的建立并利用TF-IDF权值构造方法计算了图像的相似性,以进行正确的回环检测。