基于强化学习的多自由度机械臂避障仿真研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:li13688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要考虑的问题是协作机械臂在控制过程中如何有效、灵活的进行人机协作并完成避障,因其特点,本文主要考虑的协作机械臂工作场景为协作小型货物搬运、辅助工具拾取和装配器件辅助拾取等,其具有需求精度低、灵活度高等特点。本文的目标是通过在仿真环境下的训练得到深度强化学习模型,用其代替协作机械臂控制算法的决策避障功能,取机械臂的末端位置动作为强化学习智能体的动作,取机械臂的人机交互物理信息为强化学习的环境状态信息,根据环境状态信息构造了强化学习的反馈建立函数,通过构建的强化学习模型以提高机械臂的工作效率和安全性。本文的主要研究内容及贡献如下:第一,从改善机械臂的训练效率的角度出发,在DDPG+HER模型基础上改进,设计一种基于嵌套模型的深度强化学习算法模型,其剥离了机械臂的逆向运动学模型,加快避障模型的训练速度并在最终实验中相比无嵌套模型有更好的表现。第二,考虑绕开障碍物的方法,设计了动态目标机制。当在机械臂末端执行器周围检测到障碍物时,该机制将扩大目标搜索范围,搜索轨迹附近的点作为目标点从而绕开障碍物。第三,从实际应用角度出发,搭建基于Kinct V2的仿真测试平台,导入真实人体运动信息,测试并证明本文算法的有效性。本论文使用深度强化学习算法及其相应的改进算法完成了协作机械臂在人机交互过程中的避障仿真对比实验,结果表明,(1)当操作人员(障碍物)远离机械臂时,则使得机械臂按参考轨迹运动;(2)当操作人员靠近机械臂时,基于RRT*算法的表现相比于基于深度强化学习模型的机械臂的表现差。接着,本文为了分析改进方法的重要性,设计了相关的消融实验,分析了嵌套模型与动态目标机制对于本文实验的重要性程度,结果表明,动态目标机制的改进可有效地使协作机械臂绕开障碍物到达最终目标点。最后,本文通过Kinect V2相机采集真实人体骨骼运动信息,使其与仿真环境中的协作机械臂交互进行测试实验,说明了本文算法的有效性。
其他文献
在物联网(Internet of Things,IOT)和网络物理系统(Cyber Physical Systems,CPS)的飞速发展的时代,迅速获取室内人、设备以及其他物体的位置信息是现在最受关注与发展最迅速的领域之一。超宽带(Ultra-Wideband,UWB)室内定位凭借低成本、低功耗、抗多径干扰和穿透能力强等优势,成为当今室内定位的热门技术之一。然而,随着人们对室内位置服务的要求不断增
现今,与人脸技术的相关研究已经有大量的工作并实现应用,其落地实现方法有依赖互联网云平台丰富的计算资源,有利用传统机器学习方法以降低计算量的,还有依靠带GPU的高端嵌入式平台的,但这些落地实现方法难以作为兼顾实时性、安全性、复杂环境适应性、低成本与低功耗方案推广。鉴于以上问题,本课题拟设计一种轻量级人脸检测、人脸关键点检测和人脸验证算法,自制数据集,并对数据集的增强操作随机使用了多种技巧,改善模型训
近年来,随着5G时代的来临,电力系统进入到了物联网时代。伴随着电力物联网规模的不断扩大,运行环境愈发复杂多变,暂态稳定性的问题也变得愈发严重。电力系统在运行期间,时常会因为某些部位发生短路而引发相关的故障,使整个系统进入到暂态运行状态,相关参数在受到干扰的情况下也会发生显著改变,进而会给系统形成较为显著的危害。所以积极探索对暂态稳定情况进行有效调控且可靠性较强的控制技术是非常有必要的,能够提升电网
密码技术在当下信息安全形势不断严峻的背景下,仍担任着非常关键的角色。目前,根据密钥的数量和使用方法的差异,密码算法主要被分成非对称密码算法和对称密码算法,前者在加解密过程中分别使用私钥和公钥,后者则使用同一种密钥。AES和SM4算法是当下主流的对称密码算法,在信息传输方面有较高的安全性。传统的密码算法大都通过软件方法来实现,这种方法占用资源较多,运算效率低,安全性也不足。而硬件方法拥有更高的运算效
光伏发电输出特性易受外部环境改变影响,具有非线性、间歇性等特点。为提高太阳能的利用率,需要对非线性的光伏输出进行最大功率点跟踪(Maximum Power Point Tracking,MPPT)控制。另外,光伏的输出电压较低,需利用高增益DC-DC升压变换器作为升压接口以实现并网。在现有的变换器技术中,单级多单元(Single-stage Multicell,SSMC)高增益DC-DC电能变换器
随着电力产业的快速发展,输电铁塔的建设已遍布全国各地,给人民的生产生活带来了极大的便利。当前国家大力推行的生态优先、绿色发展之路,不仅造福了人类,而且鸟类的栖息环境也受到有效的保护,日益增多的鸟类在输电铁塔上驻留、排便和安家等行为给配电线路的正常运行造成了巨大的威胁。针对这一问题,电网运维工作者和相关专家提出了多种解决方案,如安装防鸟刺和智能驱鸟器来防止害鸟在杆塔周边活动。这些方案虽然可以在一定程
随着科学技术的高速发展,精密工程技术所涉及的领域越来越广泛,包括微电子技术,纳米技术,精密加工技术,航空航天技术等领域,因此,国内外对系统的精密定位,控制方法以及系统稳定性等方面也提出了相对较高的要求。本文主要根据音圈电机的自动定位来实现镜头的自动对焦进行研究及分析。首先设计音圈电机的高精密微定位平台,该平台设计可以实现手动和自动两种对焦方式,可扩展性较强。应用伺服控制方式进行音圈电机驱动设计,有
当今社会,能源短缺及环境恶化问题日益严重,新型可再生清洁能源的开发已势在必行。作为一种清洁可再生能源,氢能是代替化石能源的最佳选择之一。电解水制氢作为一种绿色的制氢途径得到广泛研究,然而水分解的两个半反应——析氢反应(hydrogen evolution reaction,HER)和析氧反应(oxygen evolution reaction,OER)自身存在较高反应能垒,缓慢的动力学过程使得实际
人工智能的蓬勃发展不仅给各行各业带来了深刻的变革,相关的技术也逐渐应用到人们生活的方方面面。多智能体系统作为人工智能重要技术组成之一,也受到了学界越来越多的关注。早期相关研究多着重于单智能体路径规划,或者环境已知且场景相对简单的多智能体路径规划。现在应用场景的复杂性和多变性,对多智能体系统的决策能力和路径规划的效果有了更高的要求。即便在环境简单且已知的场景,传统方法对于路径规划的求解效率也不是很高
在当今我国经济不断发展的大环境下,城市的基础建设得到了大量的投入,更多的城市已经拥有了一套完善的地铁线路网络,带动了城市各区域的人流往来和经济互动,有效地缓解了地面交通压力。与此同时,更多的人们在选择出行的方式中倾向于地铁这种便利且快速的交通方式,但随着地铁线路网络的不断扩张以及地铁站内空间结构不断复杂化,用户在室内无法使用GPS定位服务的情况下,对地铁站内的空间布局依然处于传统指示牌引导的目测阶