论文部分内容阅读
机器人柔性装配技术对于提高工业产品的生产质量和效率具有十分关键的作用,为装配行业自动化和智能化发展提供技术支撑。在形状不规则、材料多样的复杂零部件装配过程中,多个部件之间配合关系复杂、空间紧凑,接触状态多样,从而导致机器人装配作业过程模型复杂度高,且难以精确建模。因此,如何处理复杂零部件装配过程中的接触多样性、状态不确定性是机器人柔性装配过程中的重要问题。本文面向复杂零部件机器人柔性装配作业需求,深入分析装配接触交互特性,构建机器人柔性装配系统,重点开展装配姿态调整技能学习、机器人操作技能优化、在线装配控制策略等内容的研究,有效解决复杂零部件装配过程中接触状态多样、装配作业难度大、过程描述困难的问题,并在构建的机器人柔性装配平台上进行算法验证,取得了良好的效果。主要研究内容与创新点包括:(1)复杂零部件机器人柔性装配系统。复杂零部件装配类型多样,以卡合、插装、贴装、嵌入等方式为主,针对操作过程中部件的位置不精确、系统刚度或弹性易变化、以及接触状态特性复杂的特点,在深入分析了典型复杂零部件装配工艺基础上,研究了几何、力、环境等多因素耦合约束条件下装配件相互作用,分析了装配接触特性;重点研究了机器人复杂零部件对象的特性约束、作业安全约束等条件,并构建基于KUKA LBR iiwa机器人柔性装配仿真和物理验证平台,为后边章节的算法验证提供了平台支持。
(2)基于深度Q网络的机器人装配姿态调整技能学习方法。复杂零部件机器人装配过程中接触状态多样、随机性强,难以建立精确的物理模型,导致机器人操作难度大,从装配环境、状态模型、装配动作空间着手,构建装配过程模型;另外由于夹具、目标零件定位偏差、接触变形等因素的影响,机器人无法根据当前的变化来调整动作行为,提出了基于深度Q的机器人装配姿态调整技能学习方法,建立策略网络优化模型,设计基于装配位移的奖惩函数,并以弱刚度复杂零部件卡合作业需求为例,在搭建的平台上进行算法模型验证。结果表明,机器人获得了装配姿态调整的技能,实现了复杂零部件的卡合装配,提高了机器人柔性装配作业的环境适应性。
(3)融合先验知识的机器人柔性装配技能优化。基于数据驱动的机器人技能学习过程本质上是建立从状态到动作的非线性映射,需要大量的模型学习数据支撑。物理机器人系统的大规模采样,需要花费大量的工作时间,导致学习效率不高。针对机器人装配姿态调整技能学习效率低的问题,从干涉机械臂动作选择的角度出发,将专家经验和操作工艺规则作为先验知识,提出融合先验知识的机器人柔性装配技能优化方法;从经验池数据存储与训练时间、经验知识库更新方面来进行优化,减少了机器人装配技能学习过程中的无效探索,提高了数据利用率;并在物理装配平台上进行了柔性卡合装配实验验证。结果表明,融入装配先验知识的机器人技能优化算法比传统DQN(Deep Q-Learning Network)算法效率提高30%,比Replay-DQN算法提高16.7%,学习效率大大提升。
(4)多模信息描述下的机器人装配策略。针对复杂零部件机器人装配过程信息不完备的问题,结合装配过程中的视觉、力等信息,建立多模信息描述下的机器人在线装配控制策略;针对机器人动作空间的高维连续性,提出基于深度确定性策略模型的装配技能获取方法;在小型断路器柔性卡合装配环节进行了装配策略的验证。在视觉起主要作用的非接触阶段,机械臂末端以较高的速度在自由空间运动,完成待装目标工件初始定位;接触阶段是以力觉信息为主来调整机器人装配姿态,装配完成后利用图像信息检测装配质量。结果表明,基于多模信息描述的装配策略有效提升了机器人柔性装配作业能力。
(2)基于深度Q网络的机器人装配姿态调整技能学习方法。复杂零部件机器人装配过程中接触状态多样、随机性强,难以建立精确的物理模型,导致机器人操作难度大,从装配环境、状态模型、装配动作空间着手,构建装配过程模型;另外由于夹具、目标零件定位偏差、接触变形等因素的影响,机器人无法根据当前的变化来调整动作行为,提出了基于深度Q的机器人装配姿态调整技能学习方法,建立策略网络优化模型,设计基于装配位移的奖惩函数,并以弱刚度复杂零部件卡合作业需求为例,在搭建的平台上进行算法模型验证。结果表明,机器人获得了装配姿态调整的技能,实现了复杂零部件的卡合装配,提高了机器人柔性装配作业的环境适应性。
(3)融合先验知识的机器人柔性装配技能优化。基于数据驱动的机器人技能学习过程本质上是建立从状态到动作的非线性映射,需要大量的模型学习数据支撑。物理机器人系统的大规模采样,需要花费大量的工作时间,导致学习效率不高。针对机器人装配姿态调整技能学习效率低的问题,从干涉机械臂动作选择的角度出发,将专家经验和操作工艺规则作为先验知识,提出融合先验知识的机器人柔性装配技能优化方法;从经验池数据存储与训练时间、经验知识库更新方面来进行优化,减少了机器人装配技能学习过程中的无效探索,提高了数据利用率;并在物理装配平台上进行了柔性卡合装配实验验证。结果表明,融入装配先验知识的机器人技能优化算法比传统DQN(Deep Q-Learning Network)算法效率提高30%,比Replay-DQN算法提高16.7%,学习效率大大提升。
(4)多模信息描述下的机器人装配策略。针对复杂零部件机器人装配过程信息不完备的问题,结合装配过程中的视觉、力等信息,建立多模信息描述下的机器人在线装配控制策略;针对机器人动作空间的高维连续性,提出基于深度确定性策略模型的装配技能获取方法;在小型断路器柔性卡合装配环节进行了装配策略的验证。在视觉起主要作用的非接触阶段,机械臂末端以较高的速度在自由空间运动,完成待装目标工件初始定位;接触阶段是以力觉信息为主来调整机器人装配姿态,装配完成后利用图像信息检测装配质量。结果表明,基于多模信息描述的装配策略有效提升了机器人柔性装配作业能力。