基于强化学习的机器人加工阻抗控制技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:detectivexiat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器人技术和产业的发展,机器人在工业生产乃至人民生产生活中都扮演着重要角色。但是由于难以获得机器人的控制模型参数,如何合理选择机器人的控制器参数甚至取得最优参数仍缺乏便捷有效的方法。尤其是引入力信息对机器人进行柔顺控制时,不合理的控制参数易使机器人陷入振荡。本文基于强化学习理论,分析控制系统代价函数形式和价值函数、控制策略的模型和更新方式,提出了一种快速可靠的机器人阻抗控制器设计和优化方法。本文的主要研究内容如下:首先,对阻抗控制策略进行研究,对比分析了基于位置和基于力的阻抗控制的原理和实现方式,获得了阻抗控制器的稳定域及机器人阻抗加工系统的整体稳定域,分析了阻抗控制对加工力的影响,并分析了基于零刚度的恒力阻抗控制原理及其存在的不足。其次,提出一种基于Actor-Critic强化学习的机器人运动控制器设计方法。分析了强化学习的原理和实现方式,将控制系统中相关概念和强化学习概念相对比,对控制系统的价值函数、策略模型的形式和更新方式进行建模,提出一种基于Actor-Critic强化学习的机器人运动控制器设计方法,进行数值仿真分析了学习参数对系统响应的影响。之后,将Actor-Critic强化学习方法应用于设计机器人阻抗控制器,并提出了安全学习策略以保证学习的安全性和效率。对机器人阻抗控制器形式进行简化,将其转化为位置、速度和外力的状态反馈形式。分析并提出了一种具有物理意义的代价函数形式,提出一种基于Actor-Critic强化学习的机器人阻抗控制器设计方法。提出了一种安全学习策略,提升了强化学习的安全性和成功率。最后通过数值仿真验证了上述方法的有效性,并分析了相关参数对系统响应和稳定性的影响。最后,在UR5机器人上完成了机器人运动控制器和阻抗控制器的设计。首先对机器人的肘关节和腕关节的运动控制器进行设计优化,证明了所提出算法对不同控制系统的适应性。之后对机器人腕关节的阻抗控制器进行设计优化,实现机器人和使用者的稳定交互,证明了所提出算法在人机交互上的应用价值。最后设计机器人加工实验,综合机器人肩、肘关节的运动控制器设计和腕关节阻抗控制器设计,实现了对薄板工件的有效加工,证明了所提出算法在机器人柔顺加工上的应用价值。
其他文献
2020年突然爆发的新冠疫情使身处疫情中心的青少年们近距离地经历并感受着此次疫情带给大家的学习、生活等各方面的影响。青少年们不仅要面临未知的恐惧以及生离死别的悲痛,且要适应线上教学的变化以及学业问题的压力,其身心健康也会受到一定消极影响。同时,青少年们的认知能力还尚待提升,社会经验还存在缺乏,因此在面临新冠疫情这种突发性的大型公共卫生事件时,他们是更容易受到不良心理影响的易感人群。而领悟社会支持的
学位
婚姻的稳定影响着社会发展、家庭和谐、子女成长及家庭成员的心理和行为,提高婚姻稳定性具有多种效益。我国城市居民的离婚率居高不下,成为各界在研究婚姻稳定性问题时关注的主要内容之一。本文以CW离婚案为对象,以小见大来探讨城市居民的婚姻稳定性问题,从而找出影响婚姻稳定性的风险因素并提出干预方案,最终为相关社会工作者针对性、高效干预居民婚姻不稳定性风险问题提供支持。研究中以文献分析法、案例分析法、访谈法为主
学位
根据机器人的未来发展趋势,人机协同工作的情况会日益增多,在与人接触时刚性机器人会产生交互的安全性不足、对于复杂环境的适应性差等问题。而变刚度关节因为含有弹性元件,可以使机器人具有较好的柔顺性、适应性和人机交互的安全性。本文针对被动负重外骨骼的设计需求,创新性地采用一种智能材料剪切增稠胶(Shear Thickening Gel,STG),利用其在冲击或者剪切作用下可以自适应变刚度的特点,提出一种变
学位
对高阻隔薄膜痕量气体渗透过程的实时观察和定量测量,是研究OLED、QLED等柔性显示器件的水氧阻隔层、可控核聚变装置中氢同位素阻隔层的关键,对薄膜阻隔性能的测量可以为新阻隔材料的研发、制造工艺迭代、微观渗透机理的研究提供支撑。本文基于现有质谱法高灵敏痕量气体渗透装置,针对目前设备存在的测量参数单一、测量周期长、准确性低等问题开展了研究:在现有理论模型的基础上,通过对气体吸附、溶解、扩散、脱附等过程
学位
机器人因具有工作空间大、响应速度快和承载能力强等特性在生产制造中应用日益广泛。目前机器人主要通过离线编程的方式完成简单、重复性的劳动,存在智能化程度低、处理复杂任务困难等问题,难以适应多品种、小批量、多规格产品的生产。随着机器人相关研究的不断深入,人机协作解决上述问题的优势越来越明显,人类的融入使得机器人系统的柔性化和智能化程度显著提升。然而,人与机器人处于同一环境中协作完成任务也对机器人的感知和
学位
柔性传感技术具有测量范围大、顺应性良好、生物相容等优点,在人机交互、电子皮肤、人体运动检测等领域具有广泛的应用前景。在人们日常生活的复杂多变环境中,机器人往往需要同时采集力、变形、运动等物理信息;然而,目前的柔性传感器往往功能单一或结构复杂,难以在紧凑的空间中实现多模式的感知功能。本文基于阻抗分析设计了一种电容电阻耦合的柔性传感器,旨在通过简单测量电路实现非线性柔性导体的电容、电阻测量,实现二维载
学位
量子通信系统作为一种新兴的通信技术,比传统的通信技术更加安全可靠,但是对工作环境要求较高,尤其是安置在舰船上的量子通信设备对横滚向及俯仰向的要求极为苛刻。因此,需要采用舰载并联稳定平台来隔离船体摇摆的干扰,保证安置在稳定平台上的量子通信设备处于稳定的工作环境。本论文围绕舰载并联稳定平台的姿态控制展开研究。针对舰载并联稳定平台的高精度姿态控制影响因素,提出了稳定平台的研究目标;采用三个电动推杆成正三
学位
本文设计了一种基于霍尔传感单元的柔性足垫,能够对人体足底分布式力位信息进行动态监测。与传统压力传感器相比,该传感器能够同时测量力和位移两种模态信息,同时具有测量精度高,变形范围大,模块化设计,制作成本低等优点。通过构建逆向求解模型,霍尔传感器输出的电压值可以定量反映压力和柔性体变形。基于这个原理,通过理论计算、数值解析和有限元仿真,完成了柔性霍尔传感单元的结构设计和快速成型制造,并进行了性能测试与
学位
球关节的姿态检测是实现精确控制球关节运动姿态的关键,目前球关节的姿态检测主要分为接触式测量和非接触式测量两种方法。接触式测量往往需要引出惯性测量单元、导轨和编码器等其他测量装置,从而引入新的惯性力和摩擦力。非接触测量主要有基于视觉、光学、电感和磁场等多种方案。基于视觉、光学和电感的球关节姿态测量往往需要大量额外的工作量和计算资源、复杂的辅助结构和较高的安装要求,在实际的生产运用中无法广泛推广。本文
学位
智能蒙皮技术集多源传感器、驱动器、数据采集系统与控制系统于一体,实时感知飞行器的各种参数,并通过反馈实现飞行器的飞行状态控制。不同工况下智能蒙皮中集成的传感器种类和个数不尽相同,智能蒙皮数据采集系统不仅要对多种传感器信号进行采集,还应能根据实际工况灵活地对采集系统的功能和通道数进行配置,目前常规的数据采集系统难以满足智能蒙皮传感器数量、种类灵活配置的应用需求。本文设计了一种智能蒙皮可重构数据采集系
学位