基于深度强化学习的液压驱动单元位置控制

来源 :燕山大学 | 被引量 : 0次 | 上传用户:sss03157017633
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人是人类生产生活中非常重要的一种科技装备,从自动化工厂流水线、日常家庭生活到地震废墟、火灾现场,机器人遍布人类生活的各个场景,用途越来越广泛,这对机器人的性能提出了更高的要求。机器人需要在大负载、未知非结构环境中保持良好的运动性能,液压驱动型足式机器人正是为这种需求而生。液压驱动单元是液压足式机器人的运动关节驱动器,是整机运动性能的基础。现今液压驱动单元多采用以传统PID控制为核心的相关控制算法,虽然具有较好的控制效果,但机器人实际运动中接触环境工况复杂多变,该控制方法在多工况适应性方面尚不理想,在未知工况下不能保持良好的响应速度和跟随精度。机器学习是一种用计算机从数据中学习有效信息的方法,能够实时学习环境特性并改变相应的控制策略,从而改善控制效果。该方法近年来迅速得到国内外各领域学者的广泛研究。本文针对足式机器人液压驱动单元,将机器学习方法用于液压位置控制系统中,开展相关研究,使该系统具备自学习能力,从而提高系统在未知工况下的控制性能,主要研究工作包括:(1)首先对液压驱动单元位置控制系统进行数学建模,利用MATLAB/Simulink搭建其仿真模型。接着基于仿真模型,对定值PID方法和变值PID方法进行仿真研究,并对比控制效果,分析控制参数变化规律,结果表明:定值PID方法控制精度较差,自适应能力较差,变值PID方法能在多工况下取得较好的控制效果,但需要不断调整参数,实际应用范围有限。(2)为了提高PID控制方法的自适应能力,采用BP神经网络对PID参数规律进行学习,形成基于BP神经网络的自适应PID控制方法。首先确定了学习样本的采集范围,接着对学习范围内各参数按照一定间隔进行划分,并进行排列组合生成有限数量的测试工况。然后测试并记录系统在各个工况下的控制性能,用第一个神经网络拟合工况参数、控制参数和系统性能之间的关系。根据第一个神经网络计算出每个工况下不同控制方法参数的控制性能,按照一定规则选择较优的控制参数。利用第二个神经网络拟合工况参数与选择的控制参数之间的关系,并将该网络用于在不同工况下自动调整控制参数。最后进行了仿真研究,并和PID控制方法进行了对比分析。(3)为进一步提高系统在未知工况下的自适应能力,针对液压驱动单元位置控制系统,设计了一种改进的DDPG(Deep Deterministic Policy Gradient,深度确定性策略梯度)控制方法。针对智能体探索效率低的问题,设计了一种基于模糊方法的探索策略;针对网络性能不足的问题,采用了基于Armijo-Goldstein搜索准则的BFGS(Broyden-Fletcher-Goldfarb-Shanno)算法训练值函数网络;针对算法稳定性较差的问题,将策略网络的输出值与系统实时误差相乘形成新的控制律。最后进行了改进的DDPG算法的仿真研究,并与定值、变值PID方法和神经网络自适应PID方法进行对比分析。(4)基于液压驱动单元性能测试实验台,对定值PID方法、变值PID方法、基于BP神经网络的自适应PID方法和改进的DDPG控制方法进行了实验研究,并根据实验结果进行对比分析。
其他文献
【目的】分析修剪强度对茶树枝叶凋落物生物量及生态水文特性的影响,为茶园凋落物水文服务功能的定量化研究与评估提供理论依据。【方法】以14年生黄观音茶园为研究对象,采用田
2005年12月5日,哈萨克斯坦中央选举委员会宣布,哈总统选举结果正式揭晓,五个候选人的得票率分别是:阿贝尔卡瑟莫夫0.38%,拜梅诺夫1.65%,耶列乌西佐夫0.32%,纳扎尔巴耶夫91.01%,图亚克
摘要:【目的】分析《南方農业学报》2011~2015年高被引论文特征,找出与同行期刊的差距,并提出进一步提升期刊影响力的发展措施,以期更好地服务三农,为传承我国的农业科研成果做出贡献。【方法】以《南方农业学报》2011~2015年刊载的论文为研究对象,在中国知网(CNKI)高级检索界面进行检索,导出被引频次≥15次的论文,然后用Excel 2007进行数据整理分析。统计数据截至2016年10月31
20世纪30年代,在波兰空军现代化改造方案中涌现出数款别具一格的双发军用飞机,它们如同波兰国徽上的白鹰那样被视作波兰空军崛起的希望,然而事实却击破了这个民族自立的梦想,波兰
【目的】选育出适合我国华南地区种植的果底钝、果横径大、光泽度好、产量高、抗病强的白茄新品种,为华南地区白茄生产发展提供优良品种。【方法】以抗青枯病优质自交系紫花矮
简介了川威炼钢厂低硅铁水冶炼工艺。生产实践表明,采取加入一定的钢包余渣和留渣操作等技术措施,可有效解决低硅铁水冶炼成渣困难、热量少、易粘枪、不利于脱磷及炉况维护等
介绍了济钢第三炼钢厂120t转炉基础自动化和传动控制系统的结构;论述了基础自动化系统电气、仪表、计算机(EIC)控制及网络通讯一体化和传动控制系统的优越性;该系统精确性和稳定
以桥式起重机为评价对象,建立基于全生命周期的桥式起重机节能评价指标体系,采用基于粗集理论中属性约简的方法对其进行约简,确定约简后该体系中各个指标的权重,并通过JSP开发技
《生理卫生》课本中提到“肝脏有贮藏养分的作用,例如能够把血中多余的葡萄糖贮藏起来。当血糖浓度减少时又可将糖元分解为葡萄糖,供人体能量需要”。“胰岛素能使血糖合成
市场营销是博物馆整体内容不可或缺的一部分,对于博物馆事业的发展具有举足轻重的促进作用。随着时代发展与科技进步,博物馆观众呈现出多元化特征,博物馆的市场营销也必然表