基于增强学习和ART2神经网络的移动机器人路径规划研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:zjian26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在增强学习和ART2神经网络的基础上,研究了移动机器人路径规划问题,并重点分析了路径规划中的避碰撞问题。本文主要的工作和创新点有以下三个方面:(1)首先针对增强学习中的策略问题,提出了一种渐进式Soft-Max行为选择策略;即在学习初始时,因为对行为掌握的经验知识不够,学习主要通过探索以得到行为的经验知识;在学习的后期则因积累了足够多的经验知识,可以更好地利用行为,同时也可以通过某种突变以达到加快或减慢学习速度的目的。其次针对连续性任务,提出了一种连续任务On-Policy增强学习方法S-Learning以及基于最先策略的增强学习方法FPRL(Foremost-Policy Reinforcement Learning),并在仿真实验中与传统的Q-Learning方法进行对比,以说明这两种增强学习方法的可行性。(2)为了解决增强学习中传统的策略查询表(lookup-table)不适合存储大量的状态值和行为值的问题,本文采用ART2神经网络存储大量的状态空间和分类模式。面对大量的分类模式,手工评估和选择分类模式是非常困难的,为此本文在ART2神经网络中引入增强学习评估和选择机制,结合成RL-ART2(Reinforcement Learning based ART2 Neural Network)神经网络,成功地解决了如何评估和选择已存储在ART2中的分类模式的问题。(3)提出了基于RL-ART2神经网络的移动机器人多障碍物避碰撞系统RLART2-CAS(RLART2-Collision Avoidance System)。为了解决多障碍物环境下,难于手工获取避碰撞规则的难题,本文采用增强学习的方法使系统可以自主获得避碰撞规则;采用RL-ART2神经网络,实现了增强学习和神经网络的集成,解决了规则存储需要占用大量内存空间的问题,并自动评估避碰效果,使系统能够通过学习获得理想的避碰行为,完成路径规划。
其他文献
<正>传送带是一种重要的物理模型,以其为素材的物理问题是高中物理习题中较为常见的一类问题,由于其涉及的知识点较多(受力分析、运动分析、牛顿运动定律、功能关系等),此类
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
2008年6月11日,美陆军在华盛顿国会大厦前首次公开展示了“非直瞄火炮”(NLOS-C)1号样车。2010年前,BAE 系统公司将向尤马试验场交付8门NLOS-C,进行机动性、安全性、可靠性
预测控制技术自70年代产生以来,以其优良的控制性能受到过程控制界的青睐。以预测控制技术为核心的多变量有约束控制软件包,更以其在应用中所显现的巨大经济效益而备受世人瞩目
柔性机器人协调操作是机器人研究的前沿课题之一,由于难度较大,目前国内外在此方面的研究成果还十分有限。本文采用新的方法,建立了柔性臂机器人,考虑关节柔性和臂柔性的机器人及
人工智能研究的目的无非是用机器模拟人脑的思维,人类的思维是多样性的,虽然很多思维现象体现为对确定性信息的处理,然而更多的现象却体现了各种各样的不确定性,而且,客观世
产妇剖宫产术中常因饱胃、手术刺激、麻醉因素、子宫收缩药物的应用会出现恶心、呕吐等症状,不仅干扰手术操作,增加护理难度,甚至有返流误吸的风险。目前常使用止吐药物如托