基于强化学习的人型机器人摆臂自平衡方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户：wyzwayjx

【摘要】

：

当下,研究者们对机器人的平衡控制研究主要集中在下肢,然而对于机器人的手部动作则较少关注。显然,机器人的手臂摆动过程中所产生的惯量会对机器人的平衡有相当的影响,而假若

【作者】

：

李劲

【出处】

：

燕山大学

【发表日期】

：

2004年期

【关键词】

：

人形机器人自平衡机器学习强化学习 Q-learning

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当下,研究者们对机器人的平衡控制研究主要集中在下肢,然而对于机器人的手部动作则较少关注。显然,机器人的手臂摆动过程中所产生的惯量会对机器人的平衡有相当的影响,而假若采用传统的数学分析建模的方法,首先需要大量的运动物理学知识,其次建立的模型未必准确而且不具有普适性。而用强化学习的方式让机器人自动学会平衡控制则既是机器人平衡算法的发展趋势又对硬件有良好的适应性。因此本文尝试用机器学习的方式学习生成机器人手臂控制算法以实现用机器人手臂摆动所产生的惯量对机器人的平衡进行调节的任务。为了简化问题,本文不考虑机器人其他关节,只考虑机器人肩部关节,即让机器人在发生前后方向上的倾斜时,让机器人通过摆动手臂来实现平衡调节。首先,用Q-learning学习算法学习生成了一个单极倒立摆的控制算法,这有助于对强化学习算法原理的理解和掌握,对于该模型所采用的是查表式的设计方法对倒立摆的状态进行划分,并用Simulink进行仿真。其次,用sarsa学习算法学习生成了另一个单极倒立摆的控制算法,并用Simulink进行仿真,并将其与Q-learning学习算法进行比较,得出Q-learning学习算法更易收敛的结论。再次,以Q-learning学习算法进行机器学习,在simrobot仿真环境下学习生成了控制机器人在直立情况下通过手臂前后摆动以保持平衡的控制算法,此问题和前面的倒立摆模型相似,不同的是它是通过摆动手臂来达到平衡调节的,并且具有更加复杂的状态空间和动作集,虽然本文已经将机器人简化到只有2个关节,但是其状态空间仍然是非常庞大的,学习最终获得了相对满意的结果。最后,以Q-learning学习算法学习,构建了一个手臂控制算法,用以在机器人行进过程中对机器人进行平衡调节,虽然没有得到优良的结果,但通过仿真及实验,展现了控制算法的有效性与及时性,同时也反映出当状态空间与动作集膨胀之后,Q-learning的学习效果也会随之下降。

其他文献

以用户体验为中心的语C类APP设计初探

论文基于用户感官、交互、情感3个方面的体验,对3款典型的语C类APP的用户体验进行分析与比较,结果表明牛哔的对话的用户体验更好,能在短时间内吸引更多的用户,并且有较强的用

期刊

语C圈APP设计用户体验

美国新近民用小型无人机管控立法析评

美国联邦航空局于2016年6月颁布的《联邦法规》第14编第107部分是美国民用小型无人机管控立法的最新发展,也是美国首次通过立法将小型无人机系统的飞行作业活动纳入国家空域

期刊

无人机系统民用无人机系统小型无人机系统航空安全遥控驾驶员美国联邦法规

聚苯乙烯/黄麻纤维复合材料的性能研究

以黄麻纤维为填料，聚苯乙烯为基体，加八偶联剂、引发剂、抗氧剂等加工助剂，制备了聚苯乙烯／黄麻纤维复合材料。由于黄麻纤维是亲水的极性材料，而聚苯乙烯是疏水的弱极性材料，两者的

期刊

聚苯乙烯黄麻纤维力学性能耐水性能耐热性能

Ce1-xScxO2-x/2固体电解质的微观结构及电性能研究

研究了Sc2O3掺杂CeO2基电解质材料的微观形貌和电性能。采用溶胶凝胶法制备了Sc2O3掺杂CeO2基电解质粉体, Sc2O3掺杂量分别为6%, 8%, 10%。采用单向压力法将电解质粉体压制为

期刊

氧化钪氧化铈掺杂电导率

“一带一路”:合作逻辑与能源安全

响应"一带一路"愿景的国家,就像四十年前的中国一样,面对的是一个全球经济发展的大势,有望利用来自包括中国在内的经济体所提供的投资和贸易机会,成为主动把握全球经济增长态

期刊

地缘经济能源安全风险管理

商业地产营销策划策略及其效果研究

社会进步带动了科学技术水平的提升,国家城市化进展加速,带动了房地产行业的规模越来越大,同时也带动了商业地产的进步.商业地产的建设发展利于城市基础设备设施的完善,可明

期刊

商业地产营销策划效果分析

Blazar天体的光变信号分析

活动星系核(AGNs)是当代天体物理研究前沿领域,对其深入研究对于认识超大质量黑洞的性质有重要意义。Blazar天体是活动星系核的一个特殊子类。在观测中,这类天体最突出的特征

学位

活动星系核Blazar天体光变周期Jurkevich方法加权小波Z变换

大寨游记

去山西省昔阳县大寨大队参观,是我40多年前的强烈愿望。40多年前,在全国农村掀起了农业学大寨的高潮。那时,我在陕西省户县大王公社康西大队当生产队长,以后又当大队(村)党支

期刊

森林公园山西省党支部陈永贵大寨村

不同性别IgA肾病患者相关临床指标及病理特点对比

目的通过对不同性别IgA肾病患者临床指标及病理特点的对比,了解性别间相关指标的差异,为临床积极有效的治疗该病提供依据。方法回顾性分析2017年1月1日~2018年8月30日我院经

期刊

IgA肾病性别临床指标病理特点

公交车儿童免票线能否“长长个儿”

近日，市民刘女士通过“百姓一线通”反映，她的孙女不到6岁，身高已经达到1.1米，每天上幼儿园都需要买票乘坐公交车。如今儿童身高普遍较高，刘女士想知道相关部门能否适当调整儿童乘

报纸

基于强化学习的人型机器人摆臂自平衡方法研究

其他学术论文