基于Agent强化学习的地图迁移学习算法

来源 :电子世界 | 被引量 : 2次 | 上传用户:fellting
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是Agent学习中广泛使用的方法,在智能机器人、经济学、工业制造和博弈等领域得到了广泛的应用,但学习速度慢是强化学习的主要不足。迁移学习可从源任务中获得与目标任务相关的知识,利用这些知识去提高学习效率与效果。本文提出Agent地图迁移算法,实现了Agent在不同状态空间下的经验迁移。实现将Agent在简单环境中的学习经验迁移到复杂环境中,实验中验证了算法可加快Agent路径规划速度。
其他文献
本文以中美日三国关系为主线,按照中国近现代历史发展的阶段特点,分4个时期,从国际关系角度论述了美国“门户开放”政策的提出、发展及最终被彻底粉碎的全过程,揭示了这一政策对华
使得建筑起重机械出现事故的因素主要包括内部因素和外部因素两部分,所谓的内部因素就是建筑起重机械设备的整体性能是否完整,设备内部是否存在各种损坏情况及其他诱发事故的
随着时代的发展以及科学技术的进步,人们在社会生活中耗费的矿产资源正在逐渐的增多,让当前社会出现了矿产资源紧张的情况,为了缓解这一现象,人们开始向地表更深的地方进行矿
【摘要】在当今大型化工企业中,DCS集散控制系统已经被广泛应用,并发挥着十分重要的作用。可以说,DCS系统已经成为化工企业正常运行的关键,而DCS系统的安全性更是化工企业正常运行的关键点。本文就DCS系统存在的安全问题进行分析。  【关键词】DCS;安全问题;接地;供电;防雷;防静电  1.引言  DCS集散控制系统是集计算机技术、通讯技术、控制技术、CRT技术为一体的综合性高科技产品。DCS通过
通过运动分析论述了削片机削片过程中遇角的变化对木片尺寸和几何形状的影响,根据对木片切料角的工艺要求可初步确定削牒同的基本尺寸,通过受力分析论述了适宜鼓式削片机加工原
建设项目施工造价编制和投标及其投标中标是决定和制约企业自身发展的手段和措施之一,是考核企业技术管理水平的体现。积极投标及中标是得到建筑项目和签订合同的手段。本文