基于Agent强化学习的地图迁移学习算法

来源 :电子世界 | 被引量 : 2次 | 上传用户：fellting

【摘要】

：

强化学习是Agent学习中广泛使用的方法,在智能机器人、经济学、工业制造和博弈等领域得到了广泛的应用,但学习速度慢是强化学习的主要不足。迁移学习可从源任务中获得与目标任务相关的知识,利用这些知识去提高学习效率与效果。本文提出Agent地图迁移算法,实现了Agent在不同状态空间下的经验迁移。实现将Agent在简单环境中的学习经验迁移到复杂环境中,实验中验证了算法可加快Agent路径规划速度。

【作者】

：

张炎刘博文

【机构】

：

包头职业技术学院计算机与信息工程系,西北工业大学软件与微电子学院

【出处】

：

电子世界

【发表日期】

：

2014年15期

【关键词】

：

Q学习强化学习地图迁移

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

评美国的“门户开放”政策

本文以中美日三国关系为主线，按照中国近现代历史发展的阶段特点，分４个时期，从国际关系角度论述了美国“门户开放”政策的提出、发展及最终被彻底粉碎的全过程，揭示了这一政策对华

期刊

门户开放侵略扩张独占中国open door policyexpansionismmonopolization of China

建筑起重机械事故分析与预防对策

使得建筑起重机械出现事故的因素主要包括内部因素和外部因素两部分,所谓的内部因素就是建筑起重机械设备的整体性能是否完整,设备内部是否存在各种损坏情况及其他诱发事故的

期刊

建筑起重设备事故因素监控预防

论岩心钻探水泥注浆护壁防塌的问题及对策

随着时代的发展以及科学技术的进步,人们在社会生活中耗费的矿产资源正在逐渐的增多,让当前社会出现了矿产资源紧张的情况,为了缓解这一现象,人们开始向地表更深的地方进行矿

期刊

岩心钻探水泥注浆护壁防塌解决措施

浅谈DCS系统的安全

【摘要】在当今大型化工企业中，DCS集散控制系统已经被广泛应用，并发挥着十分重要的作用。可以说，DCS系统已经成为化工企业正常运行的关键，而DCS系统的安全性更是化工企业正常运行的关键点。本文就DCS系统存在的安全问题进行分析。　　【关键词】DCS；安全问题；接地；供电；防雷；防静电　　1.引言　　DCS集散控制系统是集计算机技术、通讯技术、控制技术、CRT技术为一体的综合性高科技产品。DCS通过

期刊

DCS安全问题接地供电防雷防静电

鼓式削片机设计基本问题的探讨

通过运动分析论述了削片机削片过程中遇角的变化对木片尺寸和几何形状的影响，根据对木片切料角的工艺要求可初步确定削牒同的基本尺寸，通过受力分析论述了适宜鼓式削片机加工原

期刊

鼓式削片机运动分析受力分析设计木工机械Drum chipperMotive analysisAccepted force analysisMo

建筑工程预决算及投标中常见问题与采取措施

建设项目施工造价编制和投标及其投标中标是决定和制约企业自身发展的手段和措施之一,是考核企业技术管理水平的体现。积极投标及中标是得到建筑项目和签订合同的手段。本文

期刊

工程预决算投标管理建筑项目企业技术管理造价编制建设项目施工项目预算签订合同

基于Agent强化学习的地图迁移学习算法

其他学术论文