基于光学成像的自主移动机器人端到端路径规划方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:wangpengdz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自主移动机器人已广泛应用在多个生产生活领域,并在其中发挥着愈加重要的作用。路径规划是移动机器人实现导航的关键和核心,研究路径规划方法对于保障移动机器人的自主化和智能化水平等具有重要的意义。近年来,基于光学成像的传感器技术(即相机)凭借采集环境信息丰富、性价比高等优势,已广泛应用在机器人领域。当前,传统的路径规划方法通常需要事先构建精确的环境地图,这种方法在面对未知环境时无法有效地实现路径规划,并且存在过程繁琐、效率低、鲁棒性差等缺陷。针对传统路径规划方法存在的问题,本文基于深度强化学习技术,研究了一种基于光学成像的自主移动机器人端到端路径规划方法,采用学习的方式,通过让机器人不断的“试错”,学习到一种最优的移动路径。通过构建基于位姿信息的导航数据集、研究基于位姿引导的端到端路径规划模型构建等方法,实现了一种通过感知到的图像直接学习得到导航路径的端到端路径规划。论文具体的研究内容包括以下几个部分:首先,为了给端到端路径规划方法的研究提供基础的交互环境,构建了一种基于位姿信息的导航数据集。通过采用光学成像传感器采集RGB图像和深度图像,并根据这些图像获取引导机器人与环境交互、实现路径规划的必要信息:首先,利用3D目标检测方法直接获取路标间的位姿信息,实现路标间的关联;然后,通过弗洛伊德算法(Floyd-Warshall)获取任意两个路标间的最短距离,为后续路径规划模型的训练提供真值参考信息;最后,采用HDF5工具标注角度等信息,用于引导移动机器人的移动交互。通过以上方法,为基于深度强化学习的端到端路径规划方法研究提供了一种灵活的交互环境。其次,为有效提高移动机器人路径规划的效率及灵活性,采用深度强化学习手段,设计了一种基于位姿引导的端到端路径规划模型。首先,通过将位姿信息直接转换成机器人的移动动作,并设计动态的动作选择机制,实现动态的动作空间设计。接着,利用移动距离、旋转次数等导航成本,改进传统的基于移动步数的奖励函数,实现一种基于导航成本的奖励机制;最后,利用研究的动态动作空间、基于导航成本导向的奖励机制等,改进深度孪生演员-评论家(Deep Siamese Actor-Critic)网络,实现了一种基于位姿引导的端到端路径规划模型。通过使用提出的网络模型,在研究的数据集中训练机器人与环境交互,最终生成最优的移动机器人运动决策策略,指导移动机器人选择移动方向。通过以上的研究,实现了移动机器人高效、灵活的端到端路径规划。最后,为了验证本文提出的基于光学成像的的端到端路径规划方法的性能,开展了一系列的对比实验。首先,利用本文提出的基于位姿引导的数据集构建方法,选择实验室、客厅、公寓等多个常见场景,构建了移动机器人导航交互环境,为开展实验提供测试环境。然后,从导航效率、导航灵活性和端到端路径规划方法的综合性能等方面开展测试验证。实验结果表明,本文所提出的端到端路径规划方法具有良好性能。
其他文献
RGBT目标跟踪是指通过结合可见光(RGB)和热红外(T)视频数据进行目标跟踪的新兴热点研究课题。多年来,基于单模态的目标跟踪技术取得重要突破,但是该类算法在面对一些较为复杂的场景或者极端条件下仍旧难以发挥良好的性能,例如光照不足、恶劣天气、背景杂乱和目标遮挡等。由于热红外成像能够很好克服上述挑战因素的影响,弥补可见光成像的不足,而可见光图像可以补充热红外成像中丢失的颜色和细节信息,因此,合理利用
随着信息社会的高速发展,网络这种数据结构存在于越来越多的现实情境,并在计算机及其相关领域得到广泛应用,对这些网络进行分析具有很高的学术价值和现实应用价值。值得注意的是,进行有效的网络分析一般依赖于对网络的表示方式。传统的对网络进行表示的方法通常是使用高维稀疏的向量,但现如今复杂网络中的连边数量和节点数量是可能达到数十亿,因此使用传统的网络分析方法在整个网络上进行计算和推理面临很多困难。网络表示学习
社会的不断进步和持续发展促使工业生产和生活环境的多样性也在不断增加。在物品的生产和使用过程中,产品表面发生异变从而导致缺陷的发生是不可避免的。因此,如何高效、准确的检测缺陷的发生,一直是人们不断思考的问题。缺陷检测是工业生产中无法避免且必要的一个环节。科学技术的进步和近年来深度学习技术的不断突破,使得机器视觉在各个应用场景的优势也越来越明显。本文以卷积神经网络为理论基础,针对工业产品表面缺陷自动检
轴承作为旋转机械的重要组成部件,其健康状况影响机械设备的正常运行。因此,轴承运行状况的监测和诊断对保证机械设备的正常运行有着极为重要的意义。本文以列车轴承和普通滚动轴承为研究对象,提出基于改进线性判别分析(Improved Linear Discriminant Analysis,ILDA)的状态特征提取方法和基于自适应线性判别分析(Adaptive Linear Discriminant Ana
相比于回归模型参数的人体重建方法,基于图卷积网络的重建方法避免了网络难以学习旋转表示的问题,但现有的图卷积网络重建工作仍然有收敛速度慢,模型点发散和复杂姿势下模型不准确的问题。针对该问题,本文提出重建准确三维人体的多模块多层次图卷积网络结构和基于模型整合的全身三维重建技术。全文主要包括以下三个部分:1.对近年来的人体三维重建技术进行调研。对相关工作进行分类讨论,介绍了各类方法的优势和缺陷,并根据现
属性网络是描述复杂现实世界的有效工具,其中的节点之间存在边,能够描绘纷繁复杂的关系。属性网络中的节点能够携带多种属性,如文本、音频和图像等丰富信息。属性网络表示学习旨在将属性网络中的网络结构和属性等信息保存在低维的向量空间中,为节点学习低维、高质量的表示向量。属性网络表示学习获得的表示向量可以应用到多种下游任务中,例如节点分类、链路预测和可视化等。当前属性网络表示学习方法可分为两类,一类是无监督的
临近预报一般是指对某一区域未来短时间内(0-2 h)的降水量或者强对流天气进行预报,在日常的气象灾害防范中有着极其重要的作用。我国位于东亚地区,濒临太平洋西海岸,大陆性季风气候显著,这就使得我国在夏秋两季饱受洪涝灾害侵袭的困扰,因此建立一个准确的临近预报系统对我国来说是迫切需要的。准确的降水临近预报系统不仅可以有效的指导人们的日常生活,出行以及户外活动,同时对于道路交通,空中运输以及气象灾害预警的
随着商标数据的爆炸式增长,国内外发生的商标近似侵权案件越来越多,如何从海量商标数据中准确地检索出近似商标,从而辅助用户对商标进行调整,提高商标注册成功率,成为商标领域值得研究的一个问题。目前,短文本相似度计算方法广泛用于商标领域中,现有中文商标相似度计算主要是从字形、拼音及含义这三个角度出发,在字形和拼音角度存在近似判定因素单一片面的问题,在含义角度存在同义词识别不准,知识库有限和相似度计算结果不
目前气象卫星在日常生活中发挥着越来越重要的作用,人们对于卫星观测的精度要求越来越高。随着近年来各国气象卫星发射数量的增多,对卫星场地辐射定标的简便性和可持续性也提出要求。传统的人工观测和单次或几次观测已不能满足卫星遥感器在轨定标和遥感数据定量化应用的需求,亟需将场地的地表和大气光学波段辐射特性观测推向全自动、连续观测的阶段。本文在此背景下,以敦煌卫星辐射定标场为实验场地,对布设在场内的自动化观测设
随着网络社交媒体的迅速发展和人们生活水平的提高,网络文本信息也在迅速发展。微博是目前中国最受欢迎的博客应用,任何时候都在产生大量的数据。这些数据包括大量关于网民感受和态度的信息,若能将情感分析技术应用到微博产生的大量文本信息中,宏观上可以监控和引导网民在舆情爆发前后的情绪走向,从而有关部门能及时采取措施进行防控。同时,文本主题分析,舆情分析也都是以情感分析为研究基础,发掘数据情感价值,有助于完善网