基于强化学习的移动机器人路径规划研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:zq09171
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器人研究学习中,导航技术是移动机器人研究的基础,而路径规划又是导航技术的基础。所以,研究移动机器人路径规划技术,提高移动机器人的环境适应性,对机器人导航能力的提升具有重要意义。移动机器人在未知环境下的路径规划,缺乏经验知识,这就要求机器人在路径规划过程中要不断学习,积累经验,提高寻优能力。本文在强化学习的基础上,把Q学习作为主要的移动机器人路径规划算法,并针对Q学习过程中探索与利用的平衡问题,奖惩函数的设计问题和连续状态空间的泛化问题,设计了相应的解决方案。为解决机器人在Q学习过程中探索与利用的平衡问题和影响算法收敛速度的奖惩函数设计问题,利用了基于行为分解的模拟退火-Q学习路径规划算法。奖惩函数设计为基于行为分解的非均匀奖惩函数,即把奖惩函数设计为避障奖惩函数和导向奖惩函数加权和的形式,为解决学习过程中的探索与利用的平衡问题,设计了基于模拟退火算法的动作选择策略。基于模糊控制的SA-Q学习路径规划算法很好的改善了连续状态空间的泛化问题。利用模糊控制算法对复杂环境下连续状态进行泛化,并通过模糊推理得出输出动作,通过更新q值函数的形式来更新模糊规则库。在路径规划设计中,引进了针对奖惩函数和模拟退火算法的改进方案。最后,通过MATLAB进行仿真实验,证明了算法的有效性。
其他文献
介绍了一套自制的用于光化学臭氧和二次有机气溶胶生成研究的室内烟雾箱系统,对该烟雾箱系统进行了一系列表征实验,包括活性物种的壁损失速率常数的测定,以及由CO-NOx光氧化
<正>先天性肌性斜颈是小儿骨科常见病,早期治疗效果好,面部畸型可以完全纠正。我院自1998年至今,收治68例,均经手术治疗,疗效满意。现报道如下:1资料与方法1.1一般资料本组68
利用流动电流、絮凝脉动颗粒检测技术、分子量分布及XAD树脂分类技术对高锰酸盐复合剂强化混凝去除水中天然有机物的机制进行了研究.结果表明,高锰酸盐复合剂提高了硫酸铝的
目的探讨保胎灵胶囊联合间苯三酚治疗先兆早产的临床疗效。方法选取2016年9月—2017年9月在湖北民族学院附属民大医院治疗的先兆早产患者76例,随机分为对照组(38例)和治疗组(
目前,植入式广告已被广泛应用于电视剧、综艺节目、电影甚至新闻节目中。观众经历了最初的惊奇和容忍后,对于广告的过度植入容易产生抗拒甚至逆反心理,反而影响品牌宣传效果
压裂泵是压裂作业时的关键设备,压裂泵功率大、连杆负荷大、排出压力高,工作条件十分苛刻。压裂泵的损坏将使压裂工作突然停顿,易导致砂堵等井下事故,造成巨大损失。分析了滑
以正硅酸乙酯为原料,采用水解法,对100 nm亲水及20 nm亲油的NaYF4:Yb3+、Er3+上转换发光纳米颗粒进行了表面修饰,制备出了NaYF4:Yb3+、Er3+/SiO2核壳结构.研究了反应时间、反
标准的汽车销售流程可以使经销商、销售人员、顾客获得三赢局面。本文介绍了汽车销售流程及每个流程中的话术技巧,汽车销售人员通过标准化的话术和专业化的素养来留住每一位
火葬场弃尸案越闹越大,这个让活人难受、让死人难瞑目的丑闻,极大地冲击了美国殡葬业的信誉
目的:探讨与研究3D快速成型技术在创伤骨科肱骨近端骨折护理带教中的应用方法与效果。方法:将60名创伤骨科护理实习生随机分为对照组和实验组,每组30名。实验组的护理带教采
会议