基于强化学习的磁导航AGV控制方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:yushilv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着自动化仓储与先进生产系统的不断发展,自动引导车(Automatic Guided Vehicle,AGV)作为一种轮式移动机器人在物流与生产系统中扮演着越来越重要的角色。其中路径跟踪控制是实现AGV高精度导引控制的关键技术。为了在系统参数未知的情况下,针对磁导航AGV路径跟踪控制器的设计中免除大量的人工参数整定工作,并在算法迁移应用至参数不同的AGV时能够利用先前学习到的知识从而加速算法的迁移过程,本文提出了两个比较新颖的方法,其主要内容包括以下两个方面:(1)本文使用一种改进的免模型深度强化学习算法设计了路径跟踪控制器。在建立磁导航AGV离散时域的运动学和动力学模型的基础上,将路径跟踪问题建模为连续状态与动作空间的马尔可夫决策过程。同时使用了两个深度神经网络用于实现一个演员评判家(Actor-Critic)架构的异策略(off-policy)免模型强化学习算法作为控制器的实现。分别采用时域差分算法与确定性策略梯度算法用于更新Critic与Actor两个深度神经网络的参数使其分别逼近最优的动作值函数与策略函数。(2)为了在算法迁移应用至参数不同的AGV时加速其训练过程,本文引入了表示学习方法。通过使用自编码器技术来学习一个由输入信号到状态表示的映射过程,从而将状态表示学习部分与任务相关的策略学习部分分离解耦。当算法迁移应用至参数不同的AGV时,通过使用预训练的编码器取代网络的首层隐含层,以实现对输入信号的编码过程,从而缩短了算法的训练时间。此外,本文提出了一种自编码器的同步训练方法,通过使用跟踪控制算法训练过程中所产生的数据来对自编码器进行同步训练,使得自编码器的训练过程得到了加速并提高了算法对数据的利用率。
其他文献
随着经济的发展,高速公路质量的重要性愈加凸显,其中,高速公路隧道桥梁工程,不仅是人们安全出现的基本保证,也是促进我国经济快速发展的基础设施之一,所以在施工过程中,务必
小湾水电站工程规模宏大,重大技术难题众多,是当今世界上技术难度较高的水电工程之一。电站勘测、设计、科研单位昆明勘测设计研究院,深感使命神圣,责任重大,以强烈的使命感和高度
日前,中国最专业的人力资源外包服务供应商易才集团发布了《2013年易才集团薪酬研究报告》,该报告由易才集团委托国内专业调研机构CHINAHRKEY(创智中国)独立调研制作,该报告是采用
报纸
铁是肉鸡必不可少的元素之一,铁元素会对鸡的生理功能以及生产产生影响。文章综述了铁在鸡体内的分布、营养代谢以及影响肉鸡对铁吸收的因素和存在的问题。
期刊
对川西北土地沙化情况进行了实地考察,分析了川西北土地沙化的现状特点及其发生原因,并从科学发展观和构建社会主义新农村的高度,对川西北土地沙化提出了防治对策,以便为更好
本实验以猪肝脏为原料,通过肝脏异味的去除。原辅料配比的优选等加工技术研究。获得了涂抹型肝泥肠的工艺参数及不同原料的最优配比。
城市交通占我国交通行业能源消耗一半以上,是城市二氧化碳等污染气体的主要来源之一,因此,城市交通能否实现节能减排的目标,对于我国城市的发展及建设资源节约型和环境友好型
指出目前安全评价中范围确定、评价单元划分、评价方法选用、对策建议制定、重大危险源辨识工作容易出现的问题及误区,对相关问题产生的原因及带来的影响进行分析与探讨,阐明
Animals’ nature is in the animalsselves, however, human nature is not in the humanselves. The most important human nature is presented in the fact that hum
音乐是一种乐音运动的形式,治疗是以特定的方法减缓病痛和改善健康的一门科学。将音乐这门艺术与冶疗这门科学加以联系,有控制地让音乐来治疗和康复人的躯体疾患和精神障碍,保持