【摘 要】
:
传统的基于视觉的同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术不能获得周围环境的语义信息,无法满足机器人对自身周围场景的感知、理解和建模的需求。现有的大多数带有语义的SLAM方法要么假定周围环境是静态的,要么仅获取像素级别的语义信息,无法对环境中的每个物体进行实例级别的标识。这将导致机器人面临很多挑战,如无法完成人机交互、智能抓取、碰
论文部分内容阅读
传统的基于视觉的同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术不能获得周围环境的语义信息,无法满足机器人对自身周围场景的感知、理解和建模的需求。现有的大多数带有语义的SLAM方法要么假定周围环境是静态的,要么仅获取像素级别的语义信息,无法对环境中的每个物体进行实例级别的标识。这将导致机器人面临很多挑战,如无法完成人机交互、智能抓取、碰撞检测等高层次的语义决策任务;真实环境中动态物体的干扰不仅导致相机的位姿估计精度降低,还将导致建立的地图无法复用。为解决上述问题,我们设计了一种基于实例级语义信息的SLAM系统,以提高机器人在真实复杂动态场景下的相机定位精度和系统鲁棒性,同时建立剔除动态物体后的实例级别的三维语义地图,为机器人后续完成诸如智能抓取、人机交互、路径规划等高级决策任务奠定基础。本文的具体研究工作包括:(1)文章首先阐明了课题的研究背景及意义,并说明了SLAM的发展历程,以及视觉SLAM和语义地图的研究现状,基于语义信息的视觉SLAM理论基础,包括视觉SLAM常用的经典框架、相机模型、及基于直接法和特征点法的视觉里程计设计原理。最后阐述了语义SLAM的相关理论基础,包括用于物体语义信息提取的目标检测常用算法,同时也介绍了语义SLAM的相关算法。(2)本文提出了一种动态环境下剔除移动物体的视觉里程计设计方法,旨在解决普通视觉SLAM在复杂动态环境下无法获取环境语义信息和定位精度低的问题。针对普通语义分割任务中分割精度不高的问题,提出了一种基于上下文关联信息优化的语义分割算法,以提高分割精度。针对传统视觉SLAM在动态场景下位姿估计精度差的问题,提出了一种基于实例级语义信息的动态对象特征点检测与剔除算法,大大提高了视觉SLAM在动态环境下相机位姿的估计精度和系统的鲁棒性。在数据集和真实环境下进行相关实验,结果证明了本文算法在动态场景下相比于其他算法具有一定的优势。(3)本文提出了面向物体实例级的三维语义地图构建相关算法,旨在构建一个全局化、静态化和标签化的三维语义地图。针对物体遮挡等原因导致深度图像存在黑洞的情况,提出了一种基于语义自适应的联合均值和双边滤波算法,以建立目标物较完整的语义地图。同时提出了一种实例级三维物体语义标签库的构建与更新算法,并在此基础上构建了面向物体实例级别的三维语义地图。在动态数据集和现实动态环境下进行相关实验,结果验证了本文算法的效果和价值。
其他文献
旋转机械是现代工业系统中最为重要的组成部分,随着大数据和人工智能等先进技术的发展,深度学习已经成为智能故障诊断领域的热门话题。然而在实际工况下,智能故障诊断方法的研究过程中往往会出现的以下两个问题:(1)标签数据不足,导致模型无法收敛。(2)不同工况,不同类别空间的故障诊断方法难以通用。因此,如何在少量样本下完成故障诊断,如何实现训练数据和测试数据不同工况下的高精度故障诊断以及跨部件的智能故障诊断
工业控制系统(Industrial Control System,ICS)测试床仿真模拟工业生产过程,广泛用于生产控制优化、计划与资源优化、人员培训、安全评估与安全测试研究等。现有包含实物的实物复制测试床、半实物测试床搭建成本较高,且测试床规模远不及实际系统的规模,导致基于测试床的相关研究具有一定的局限性;基于软件联合的纯软件仿真类测试床,不便于开展网络攻防等交互性要求较高的相关研究与测试。针对以
随着科技的迅速发展,实际应用领域涌现出大量流数据,这些数据不仅具有海量、快速、含多个标签与特征高维的特点,且其数据分布会随时间动态变化引起概念漂移等问题。因而如何在多标签流数据环境下快速挖掘有效信息,成为数据流分类的重要研究任务之一。本文旨在针对概念漂移和流特征的多标记流数据分类问题开展研究,主要研究工作包括:(1)针对多标签流数据的概念漂移问题,提出一种基于核极限学习机的数据流集成分类方法。首先
伴随着大数据时代的来临,数据获取的方式和途径较以往更加便捷,大量的高维数据出现在各个应用领域,如人脸识别等。然而,这些高维数据会大大增加计算量,同时其冗余特征也会影响数据分析的结果,很多应用场合必须进行降维。因此,高效的数据降维方法在实际应用中具有重要意义。近年来,图模型被广泛地用于数据降维研究工作中,图嵌入方法作为其重要的技术手段引起了很大的关注。以图判别嵌入为代表的传统图嵌入方法使用k近邻去选
隐写是一种基于信息隐藏的隐蔽通信技术或隐蔽存储方法,通过难以感知的方法将秘密信息隐藏在可以公开的载体中。在隐写与隐写分析的长期对抗发展过程中,隐写研究者提出了丰富的图像隐写思路与方法。无嵌入图像隐写算法不存在被修改的载体图像,虽然理论上具有很高的安全性,但是普遍存在图像特性单一和生成图像质量差的问题。嵌入式图像隐写算法通过修改载体图像的方法进行秘密信息写入,因此容易留下修改痕迹而受到隐写分析模型的
随着互联网的不断发展,视频网站拥有巨大的用户访问数量能够给服务提供商带来可观的收益,向用户推荐流行度尽可能高的视频可以吸引更多用户的关注;同时为了缓解核心网络的流量负载,降低用户获取视频的时延,制定以视频流行度为缓存替换策略的算法可以增加缓存的命中率,提升用户的服务体验质量。因此,视频流行度的预测问题成为了一个急需解决的问题。本文针对传统的视频流行度预测算法在中长期预测中存在预测精度低、自适应性弱
近几年来,卷积神经网络在计算机视觉,自然语言处理和语音识别等领域上取得了突破性的进展。尽管卷积神经网络具备强大的特征表达能力,但模型的过参数化和高计算复杂度使其在训练和推理过程中消耗大量硬件资源,让模型部署在资源受限的嵌入式设备上变得异常困难。因此,研究如何在不降低网络精度的前提下压缩神经网络模型,对于深度学习技术的普及具有重要意义。本文在现有压缩算法的基础上,对其进行优化改进并完成了以下工作:(
特征选择已经被广泛地研究和使用在机器学习和模式识别领域,因为它能够减少问题的复杂度,同时提升学习算法的预测精度。但是,传统的特征选择算法依据特征和类别变量之间的相关关系选择相关特征、去除无关特征,从而没有试图学习它们之间的因果特征。近些年,基于马尔科夫毯的特征选择已经吸引了越来越多人的关注,因为它比传统的特征选择算法具有更好的鲁棒性和可解释性。基于马尔科夫毯的特征选择旨在发现类别变量的马尔科夫毯(
特征选择方法在数据分析与降维中发挥着重要的作用。目前很多特征选择方法存在着一些共性问题,如大量的参数调节、运行时间长、特征的预测效果差等,如何开发出一种适合实际环境使用、减少人为干预的高性能特征选择方法目前仍是一个挑战。另一方面,特征选择与因果发现领域的贝叶斯网络结构学习理论存在着很多重要的联系。目前大多数因果学习算法存在着时间复杂度高,精度差的缺点,此外它们在流特征环境、连续型数据与非线性与弱加
随着数字多媒体与计算机技术的发展,隐写术能以更加难以察觉的方式将秘密信息隐藏在数字多媒体中(如文本、图像和音视频等)。隐写术的滥用不仅威胁到每个公民的隐私安全,更关系到整个国家的繁荣与稳定。为了提高隐写检测准确率,隐写分析者提出了基于卷积神经网络的高级图像自适应检查算法。这类算法通过不断学习网络模型结构中的相关参数,挖掘数据中隐含的复杂关系,提取图像中的数据特征。这不仅大大降低了对研究人员经验和精