论文部分内容阅读
针对未来室内机器人对三维语义地图的需求,本文从自主性、扩展性和可用性出发,考虑如何实现:1)机器人具有自主利用RGBD图像序列进行同步定位与地图构建(SLAM,Simultaneous Localization and Mapping)的能力;2)机器人具有从所处环境中检测、分类和识别认证物体实例的能力,从而可以构建全局一致的语义地图。3)机器人具有保存、组织和挖掘室内环境信息,理解人类所下达任务中的概念,进而实现人机共融的能力。本文通过研究上述三个子问题,探索基于RGBD传感器的自主构建室内语义地图的新途径。具体来说,本文的主要工作分为以下三个方面:第一,从理论分析结合数学模型推导,详细介绍了基于RGBD图像的视觉SLAM技术。本文在优化过程中融入逆深度信息,然后利用公开数据集进行算法评估,并通过实验室真实环境对算法进行实验;第二,基于区域检测和掩码的卷积神经网络(Mask-RCNN,Mask-Region with CNNfeature)技术,并与图分割技术相结合,实现单帧图像的语义标注,利用相机的位姿估计,构建了语义标注地图。在语义标注地图基础上,本文将SLAM技术和目标识别技术深度耦合,进一步构建了面向物体的语义地图;第三,本文基于OWL语言(Ontology Web Language)建立了环境中物品的本体模型,定义了实例属性和相关推理规则。利用前述语义地图创建实例,构建了面向本体的语义知识库。本文主要贡献和创新之处包括如下三个方面:首先,本文从视觉SLAM技术出发,结合深度学习技术,构建了基于三维体元的带语义标注的地图模型,在二者基础上又提出了面向物体的语义地图;其次,本文探索了视觉SLAM技术与深度学习技术互相促进的方法;最后,本文基于面向物体的语义地图,探索了保存、组织和挖掘环境语义信息的方法。本文的研究对于提高室内服务机器人的智能水平具有一定参考价值。