论文部分内容阅读
随着人类社会的快速进步,工厂里的货物装卸和搬运任务越来越多。人类劳动具有疲劳性,无法一直保持高度的准确性,并且很多装卸任务的工作环境危险不适合人类作业。为提高搬运和装卸的流程效率,本文搭建了机器人流水线自动装卸系统,并对物理系统进行了等比例虚拟仿真,减少了工业流水线在落地之前遇到的生产风险。在机器人的实际抓取过程中,会存在很多非结构化而且多样化的工作环境,研究强化机器人的学习能力显得很有必要。本文首先介绍了机器人流水线自动装卸系统的硬件组成和软件设计。硬件组成中输送系统选用直线输送机和可以360°旋转的仓储转台,搬运系统选用KUKA KR6 R900机器人和KUKA LBR IIWA 7R800机器人,控制系统选用PLC(Programmable Logic Controller)控制柜。软件设计采用分模块进行的方法,对每一个模块进行分开编程,设计了友好的HMI(Human Machine Interface)人机交互界面,实现了机器人流水线自动装卸系统能够循环往复进行作业。其次,基于V-REP(Virtual Robot Experiment Platform,虚拟机器人实验平台)建立了KUKA KR6 R900机器人和仓储转台的物理模型,在虚拟实验平台上等比例还原了机器人流水线自动装卸仿真系统。对机器人进行了逆运动学分析,采用了阻尼最小二乘法进行机器人逆解运算,还对机器人进行了碰撞检测,证实了在整个装卸过程中机器人没有与外界发生碰撞。介绍了V-REP中的四种物理引擎,通过分析比较,从整个系统运行的稳定性出发最终选用Newton引擎。机器人的轨迹规划采用在关节空间进行三次样条插值的方法,使得机器人的位移—时间曲线具有良好的二阶可导性,运动平稳精准。最后,分析比较了各类主流强化学习算法的特点,基于连续运动的可控性和稳定需求,选定DDPG(Deep Deterministic Policy Gradient)算法用于机器人定点运动控制的强化学习。在Python环境中以二连杆机器人为例运用所设计的深度强化学习方法进行了训练。采用控制变量对比分析的方法,探讨了引导机器人快速接近目标点的奖励手段与有/无约束条件的收敛速度差异。最终结果证明有约束条件的强化学习训练效果更佳。