基于深度强化学习的四足机器人运动控制方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:cupzss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和人工智能技术的快速发展,机器人的运动控制研究成为机器人领域的研究热点。腿足式机器人可以选择最佳落地点作支撑,对非结构环境具有更强的适应性,面对复杂地形更具优势。四足机器人因其良好特性,在军事、医疗、教育等领域展现出了广阔的发展前景。传统的四足机器人控制方法复杂且针对单一任务,控制器的设计往往需要大量的计算,这类控制方案费时费力。随着各种智能算法的迅速发展,强化学习展现出了巨大优势,为了使四足机器人获得更好的运动性能,引入了深度强化学习控制方法,文章的主要研究工作如下:1.四足机器人建模与运动学分析。用D-H方法进行运动学建模,对机器人进行正逆运动学分析,确定机器人足端工作空间,对四足机器人步态进行分类和介绍,介绍实验所用的Webots仿真平台及搭建的四足机器人模型。2.提出基于CPG的四足机器人运动控制方法。介绍Hopf振荡器模型并分析其各个参数对振荡器输出的影响;分析四足机器人足间和足内的协调控制,建立耦合的CPG网络模型,降低了模型的复杂度;对模型输出轨迹进行参数整定并进行仿真实验验证与分析。3.提出基于DDPG强化学习的四足机器人运动控制方法。介绍强化学习概念和DDPG强化学习算法;设计强化学习控制器,包括探索噪声选择、状态空间和动作空间设计、奖励函数设计、终止条件设计及深度网络设计;实现Webots软件下算法与机器人的通讯;进行仿真实验与分析。4.提出基于CPG与DDPG结合的运动控制方法。针对传统控制和强化学习方法的不足,提出了两种CPG与DDPG相结合的控制方案。一种是基于轨迹引导的强化学习控制方案,将CPG网络输出作为参考轨迹指导学习过程,将DDPG作为反馈调整部分提高机器人的适应性;一种是基于分层控制的强化学习控制方案,DDPG作为高级控制器学习CPG低级轨迹生成器的部分参数。在仿真环境下对两种控制方法进行实验验证。
其他文献
近年来,我国城镇化进程一直在不断加快。而城镇化发展的背后是对土地的大量需求,由此形成了“征地—拆迁—安置—上楼—村改居”的一条政府主导的城镇化路径,从而产生了越来越多的安置人口。这些安置人口是在很短的时间内从农村“搬入”了城市,他们必然经历着身份、习惯、社交、文化、心理等全方面的变化。在这些人中,老年人面临的问题更多,作为弱势群体的安置老人在变革面前被动性更加明显、适应难度更大,这不仅影响到安置老
学位
在我国营商环境不断优化的背景下,市场主体数量高速增长,不断涌现出新型商业模式。同时随着机构进行了改革与部门整合,市场监管部门监管责任与监管范围不断扩大,传统的监管模式已跟不上社会发展趋势。政府相关部门和公共管理学界也对能够适用于当前市场经济秩序的创新监管模式越来越关注。信用为基础的市场监管模式,着重加强政府部门事中事后监管,以公示促监管,在创造更加平稳健康的营商环境方面具备独特的优势,有利于激发市
学位
<正>气管切开插管是通过外科方法建立一个长期或暂时的呼吸通道,即切开气管颈段前壁(甲状软骨上),插入特质的导管,从而解除窒息,保持呼吸道通畅的急救手术。可作为创建人工气道的替代方法。为气管切开患者提供有效的气道护理措施,能够避免患者出现感染等并发症,有助于患者预后和康复。
期刊
李渔的美学思想主要集中在《闲情偶寄》这部论著中。李渔不仅对中国古代戏剧美学进行了全面的总结,还在仪容、生活、园林美学等方面有独特的见解。随着中国综合国力的不断提升,中国美学正在融入国际美学界,对李渔美学思想的研究也应当具备国际视野。本文以英语世界对《闲情偶寄》中所体现的李渔美学思想的译介与阐释为研究对象。首先对有影响力的译介本、专著和论文进行梳理;其次分析译介与研究者材料选择的侧重点;再者挖掘李渔
学位
克劳福德以对康德美学思想的研究为基点,呈现出独特的自然审美观。西方自然美学在20世纪60年代复兴之后,一批学者站在各自立场为其正名。而克劳福德的自然审美理论凭借着从自然美与艺术美的比较出发,提出自然美艺术美三重关系、自然审美对象再度界定、对“如画”欣赏的辩护以及对废墟的双向欣赏立场等观点,在一众自然环境美学家中可谓特点鲜明,具有较高的研究价值与意义。绪论对这位似乎名不见经传的学者进行介绍。包括其主
学位
语文学是我国传统的以文字或书面语言为研究对象,注重文献资料考证和故训寻求的一门学科。研究范围涉及文字学、训诂学、音韵学和古典文献学等,与经学的联系十分紧密。本文认为,凡在小学(文字、音韵、训诂)、古典文献学和儒家经典研究、传承中有所建树的人都应该算作语文学家,其中也包括在语文教育方面做出较大贡献的人物。隋唐五代是中国社会文化发展全面繁荣的时期。隋国虽短命,却实现了政治上的统一,为唐代文化的繁荣奠定
学位
多孔介质是由固体骨架和固体骨架之间相互连接的间隙构成的一种物质,其广泛存在于自然界和社会生产中的各个领域,如能源、换热、化工和机械等领域。流体与多孔介质之间的传热传质问题一直是一个研究热点,学者们主要通过理论分析、数值模拟和实验三种方法对流体与多孔介质之间的传热传质进行研究。其中,纯流体与多孔介质区域交界面处的可渗透边界条件一直是学者们研究的热点,随着研究的不断深入,学者们主要提出三种可渗透边界条
学位
“这+人称代词+就+VP+了”是现代汉语常见口语结构,根据对BCC和CCL两大语料库内语料的调查,发现能进入此结构的人称代词有“你”“我”“您”“他/她”“我们”“你们”“咱们”。对结构组成成分进行分析,得知“这”的语用功能是将听者注意力引向言者注意力所在之处,其语篇功能是衔接功能。“了”是语气词,在结构中存在变体。对结构中的VP从语法性质、音节数量、情感语义三个层面进行分析,总结出“这+人称代词
学位
电化学放电作为一种新型特种加工方式,由于加工对材料本身属性没有要求,因此广泛的用于玻璃、陶瓷这类绝缘硬脆材料。但由于其材料去除机理的特点,加工过程中存在着许多尚未有效解决的问题,特别是在电化学放电加工小孔过程中,由于侧壁放电所导致入口热影响区、孔锥度以及电解液循环困难导致放电不连续等问题,使得加工所得小孔的尺寸精度和深度无法同时保证。因此本文采用超声振动管电极电化学放电加工方式,利用超声振动以及管
学位
近年来,随着世界范围内沿海国家海洋战略的实施,人类社会向海洋要资源和能源的步伐日趋加快。开发经略海洋必先了解海洋,海洋浮标是目前人类社会了解海洋的主要物理技术手段之一,在海洋科学研究、天气预报、海洋开发、海防建设等领域具有重要作用,但目前海洋浮标一般采用蓄电池或太阳能的供电方式,由于供电能力弱,导致现有海洋浮标许可荷载功率只有几十瓦,不仅允许搭载传感器种类和数量有限,而且数据传输实时性较差。海洋浮
学位