基于强化学习的人型机器人摆臂自平衡方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:wyzwayjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下,研究者们对机器人的平衡控制研究主要集中在下肢,然而对于机器人的手部动作则较少关注。显然,机器人的手臂摆动过程中所产生的惯量会对机器人的平衡有相当的影响,而假若采用传统的数学分析建模的方法,首先需要大量的运动物理学知识,其次建立的模型未必准确而且不具有普适性。而用强化学习的方式让机器人自动学会平衡控制则既是机器人平衡算法的发展趋势又对硬件有良好的适应性。因此本文尝试用机器学习的方式学习生成机器人手臂控制算法以实现用机器人手臂摆动所产生的惯量对机器人的平衡进行调节的任务。为了简化问题,本文不考虑机器人其他关节,只考虑机器人肩部关节,即让机器人在发生前后方向上的倾斜时,让机器人通过摆动手臂来实现平衡调节。首先,用Q-learning学习算法学习生成了一个单极倒立摆的控制算法,这有助于对强化学习算法原理的理解和掌握,对于该模型所采用的是查表式的设计方法对倒立摆的状态进行划分,并用Simulink进行仿真。其次,用sarsa学习算法学习生成了另一个单极倒立摆的控制算法,并用Simulink进行仿真,并将其与Q-learning学习算法进行比较,得出Q-learning学习算法更易收敛的结论。再次,以Q-learning学习算法进行机器学习,在simrobot仿真环境下学习生成了控制机器人在直立情况下通过手臂前后摆动以保持平衡的控制算法,此问题和前面的倒立摆模型相似,不同的是它是通过摆动手臂来达到平衡调节的,并且具有更加复杂的状态空间和动作集,虽然本文已经将机器人简化到只有2个关节,但是其状态空间仍然是非常庞大的,学习最终获得了相对满意的结果。最后,以Q-learning学习算法学习,构建了一个手臂控制算法,用以在机器人行进过程中对机器人进行平衡调节,虽然没有得到优良的结果,但通过仿真及实验,展现了控制算法的有效性与及时性,同时也反映出当状态空间与动作集膨胀之后,Q-learning的学习效果也会随之下降。
其他文献
论文基于用户感官、交互、情感3个方面的体验,对3款典型的语C类APP的用户体验进行分析与比较,结果表明牛哔的对话的用户体验更好,能在短时间内吸引更多的用户,并且有较强的用
美国联邦航空局于2016年6月颁布的《联邦法规》第14编第107部分是美国民用小型无人机管控立法的最新发展,也是美国首次通过立法将小型无人机系统的飞行作业活动纳入国家空域
以黄麻纤维为填料,聚苯乙烯为基体,加八偶联剂、引发剂、抗氧剂等加工助剂,制备了聚苯乙烯/黄麻纤维复合材料。由于黄麻纤维是亲水的极性材料,而聚苯乙烯是疏水的弱极性材料,两者的
研究了Sc2O3掺杂CeO2基电解质材料的微观形貌和电性能。采用溶胶凝胶法制备了Sc2O3掺杂CeO2基电解质粉体, Sc2O3掺杂量分别为6%, 8%, 10%。采用单向压力法将电解质粉体压制为
响应"一带一路"愿景的国家,就像四十年前的中国一样,面对的是一个全球经济发展的大势,有望利用来自包括中国在内的经济体所提供的投资和贸易机会,成为主动把握全球经济增长态
社会进步带动了科学技术水平的提升,国家城市化进展加速,带动了房地产行业的规模越来越大,同时也带动了商业地产的进步.商业地产的建设发展利于城市基础设备设施的完善,可明
活动星系核(AGNs)是当代天体物理研究前沿领域,对其深入研究对于认识超大质量黑洞的性质有重要意义。Blazar天体是活动星系核的一个特殊子类。在观测中,这类天体最突出的特征
去山西省昔阳县大寨大队参观,是我40多年前的强烈愿望。40多年前,在全国农村掀起了农业学大寨的高潮。那时,我在陕西省户县大王公社康西大队当生产队长,以后又当大队(村)党支
目的通过对不同性别IgA肾病患者临床指标及病理特点的对比,了解性别间相关指标的差异,为临床积极有效的治疗该病提供依据。方法回顾性分析2017年1月1日~2018年8月30日我院经
近日,市民刘女士通过“百姓一线通”反映,她的孙女不到6岁,身高已经达到1.1米,每天上幼儿园都需要买票乘坐公交车。如今儿童身高普遍较高,刘女士想知道相关部门能否适当调整儿童乘
报纸