【摘 要】
:
导航是智能机器人系统的核心技术,已成为当今众多学者的研究热点。深度强化学习作为提高移动机器人自适应能力的有效算法,在移动机器人自主导航领域有广泛的应用前景。本文以
论文部分内容阅读
导航是智能机器人系统的核心技术,已成为当今众多学者的研究热点。深度强化学习作为提高移动机器人自适应能力的有效算法,在移动机器人自主导航领域有广泛的应用前景。本文以深度强化学习中的DDQN算法为核心,研究移动机器人在未知环境中的运动策略学习问题。论文首先分析了移动机器人导航算法与深度强化学习算法的国内外研究现状,对深度强化学习的基本原理、利用与探索问题、奖励值、经验回放机制与梯度下降等问题做出详尽描述。论文设计了以DDQN算法为核心的全向移动机器人导航理论框架,根据导航任务制定了一种距离导向奖励值,确定了DDQN的神经网络结构与算法训练流程。考虑到DDQN算法在前期收集训练数据时多采用随机策略,会限制算法收敛速度,论文采用了定向探索策略与玻尔兹曼探索策略对?-贪婪策略进行改进,以提高移动机器人前期探索的导向性,尽量获取高奖励值的训练数据。论文建立了Gym-ROS-Gazebo联合仿真环境,通过仿真实验训练基于DDQN的导航策略,验证算法的有效性。实验表明,论文定义的奖励值模型能够帮助机器人完成导航任务,改进后的动作选择策略能够在前期的探索中获取更高的奖励值,缩短完成训练所耗费的训练轮数,提高了训练效率。使用相同的导航框架,与差速移动机器人相比,全向移动机器人到达目标点所用的步数更少,说明此方法更适合全向移动机器人。
其他文献
目前,混凝土结构桥梁在公路系统中的占了很大比重,由于混凝土材料的干燥收缩以及与外荷载的共同作用,在养护初期极易形成表面干缩裂纹,这种裂纹的进一步扩展不仅影响桥梁结构
近数十年来滑模控制作为一种具有高鲁棒性的非线性控制方法,得到了大量学者的深入研究。滑模控制理论是一种具有控制器设计简单,控制时间较短,抗干扰能力强,物理上容易实现等
光纤传感技术是一种基于光纤和信号传输而衍生出来的新兴传感技术。光纤传感器的传感灵敏度是传统传感器的几倍,可以持续在高压、高温、高噪声、强腐蚀等恶劣环境中运行。基
伴随互联网技术的发展,我国社会和媒介生态都发生变化,公益传播出现了前所未有的新模式。越来越多的公益组织开始使用微信、微博、手机APP等新媒体平台作为公益传播的阵地。2
为了设计一种形貌与边缘复合测量系统,能够兼具形貌、边缘、阶高等多种测量功能,本文主要完成了如下几项工作:1、设计并搭建了基于干涉原理的光路系统。利用Linnik型相移显微
糖尿病性视网膜病变(Diabetic Retinopathy,DR)是常见的糖尿病慢性并发症之一,是一种导致视网膜微血管损害的病变。一旦发生DR将会严重影响视力,情节严重者将导致永久失明。
随着陆地资源的日益枯竭,人类对海洋资源的开发和利用越来越关注,海洋在国家经济发展格局和对外开放中的作用也更加重要。由于濒海作业对海洋经济发展、海洋科学研究等领域至
国内外研究表明,橡胶混凝土是一种延性较强但强度弱于普通混凝土的复合材料,适用于有抗震要求的结构中。为验证橡胶混凝土的抗震性能,本文将其用于钢管混凝土(CFST)拱桥的拱
铸牢中华民族共同体意识,是习近平总书记深刻把握中国历史文化和世界民族发展规律作出的重大论断,是我们党对民族工作认识的一次历史性飞跃,是新时代民族工作的鲜明主线和战
应用于液晶平板显示屏自动光学检测仪器中的气浮工作台运载单元因为其具有几乎无磨损、精度高、无污染等优点,广泛应用于光学测量加工、超精密机械加工、航空发动机测量制造