基于SAC算法的机械臂控制策略的研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:dark_hu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机械臂作为一种常见的自动化设备,关于其控制算法的研究,一直是相关领域的热点。近年来,随着社会人口老龄化带来的劳动力短缺,以及工业5.0概念的发布,机械臂应用领域在不断扩展,应用环境也变得更加复杂,这对机械臂运动轨迹的规划控制提出了更高的要求。本文结合目前比较热门的人工智能理论,将强化学习方法引入到机械臂控制中,提出一种基于Soft Actor-Critic(以下简称SAC)算法的控制策略,以更好地解决三维空间下多轴机械臂的轨迹规划问题,不仅可以克服传统控制算法存在的模型依赖性高,规划精度低的不足,并且相比一般强化学习算法,具有更快的学习效率和更高的稳定性。本文的主要工作和结论如下:首先,阐述了机械臂控制的相关理论,分析了目前常见机械臂控制算法存在的不足。在此基础上,将基于最大熵理论的SAC算法与机械臂控制相结合,并通过详细的论述,说明了SAC算法的原理和其应用于机械臂控制的优势。其次,针对机械臂控制中比较复杂的规划任务,提出一种策略组合的方法。通过把总体任务拆分为几个子任务后,依次解决子任务后得到相应的模型,利用SAC算法策略熵最大化的特点,将子任务的模型作为初始条件进行训练,最终得到总体任务的最优解。并在Mujoco平台进行模拟实验,验证基于SAC算法的策略组合的可行性,并与直接在线规划的结果进行对比分析。最后,对提出的SAC算法用于三维空间中多轴机械臂的规划控制,进行了实验与分析。在Coppelia Sim平台上搭建仿真环境,选择UR5机械臂作为实验对象,对控制任务进行建模分析后,设计状态与动作变量、奖励函数与系统参数。实验分为三组:无障碍物环境下的控制实验,验证了SAC算法通过改变机械臂关节角度实现机械臂控制的可行性;在有障碍物环境下的两组避障规划对比实验中,根据不同算法的特点,设置了不同的对比标准,分析比较SAC与DDPG,RRTstar两种算法的规划结果。结果表明:基于策略熵最大化的SAC算法,提高了训练样本利用率,保证了学习结果的最优。在用于三维空间中多轴机械臂控制任务时,相比于确定策略的强化学习算法和传统控制算法,规划计算更快、稳定性更好、轨迹更为平滑。在解决复杂规划任务时,通过策略组合的方法,可进一步提高训练速度的同时保证规划结果的最优,降低了规划成本,具有很好的实用价值。
其他文献
含氮杂环化合物广泛存在于天然产物、医药、农药、功能材料、有机合成中间体等重要分子中。因此,含氮杂环化合物的合成和官能团转化一直是有机化学领域的研究热点。近年来,偶
研究目的:本研究以SH-SY5Y细胞为实验对象,使用棕榈酸(Palmitic acid,PA)模拟高脂模型,通过洛利普兰(Rolipram,Rol)预处理SH-SY5Y细胞,探讨Rol对PA导致的神经元细胞损伤的保护作用及其机制。研究方法:1.采用MTT监测不同浓度Rol(0.2,2,20,100,200μM)对SHSY5Y细胞的作用,选取最佳的Rol浓度。2.采用MTT监测不同浓度PA(25,5
近年来,国家对金融领域中银行业引入良性竞争的机制。一方面,互联网金融等新兴金融机构的崛起对银行业造成一定的冲击;另一方面,银行业准入门槛持续降低,国内越来越多不同类型银行拿到营业执照开始进入银行业,加剧了行业内业务尤其是信贷业务的竞争;同时,金融领域内的证券公司、保险公司飞速发展,让原本处于金融业龙头地位的银行渐渐失去了优势。银行业从黄金时代走向白银时代,行业内大量的信贷精英人才跳离埋头苦干了多年
全世界大约有3500多种蚊虫,分布在世界各地,其中很多蚊虫是重要的疾病传播媒介,可以通过吸食血液传播20多种疾病,例如疟疾、登革热、黄热病、西尼罗热、丝虫病和流行性乙型脑
2015年,我国A股市场经历了前期的高速上涨和后期的股灾崩盘,上证指数在短短两个月时间里跌幅超过45%。国家为抵御系统性风险,推出了一系列维稳措施,并支持上市公司采取增持手
目标跟踪是计算机视觉领域研究的热点之一,在人机交互、军事侦察以及无人驾驶和安防监控等诸多方面均有着广泛的应用前景。近年来,跟踪算法的性能得到了广泛的提升,但在实际的跟踪环境下,仍然有许多挑战,比如目标会受到背景杂波、尺度变化以及遮挡等复杂情形的影响。本文以孪生网络跟踪框架为基础,分别在目标存在背景杂波、尺度变化和遮挡的条件下进行了深入的研究与探讨。本文主要工作内容及成果如下:(1)研究了一种基于分
荞麦芽苗菜是采用无土栽培技术培养的新型蔬菜,主要是指利用荞麦(Fagopyrum esculentum Moench)的种子在适宜的条件下培育出可供人们食用的嫩芽、幼苗蔬菜。荞麦芽苗菜营养丰富
煤矸石广泛分布于全国各大煤矿区域。煤矸石作为煤层开采和洗选过程中产生的废弃料,常用于路基填筑。煤矸石填料属于粗颗粒土,在压实过程中形成双孔隙群结构,其土水特征曲线(SWCC)具有双台阶现象。而SWCC与土体非饱和渗透系数密切相关,对路基内部水分运移有重要影响。同时,煤矸石具有一定的崩解性,对路基稳定性和长期累积变形有重要影响。因此研究煤矸石SWCC和荷载与干湿循环耦合作用下的固结特性,对煤矸石填料
强光光源的出现使得非线性光学这一新兴学科开始了蓬勃发展。非线性光学在激光技术、光电子技术、光限幅、光调制及通讯技术等领域都发挥着重要作用。近年来,随着科学技术的
开发清洁和可再生的化学燃料被广泛认为是减轻社会环境污染和能源相关问题的最有前景的方法。氢能由于无污染、燃烧价值高、可再生等优点被认为是一种可持续、清洁的环境友好