论文部分内容阅读
机器人自动化生产线作为数字化车间和智能工厂的主体设备,在智能制造中起到至关重要的作用。机器人搬运生产线是其中一种典型类型,并广泛应用于货物搬运、包裹分类、零件提取等方面。因此研究机器人搬运生产线的调度优化问题,以实现长期运行情况下系统综合代价最低,对于实际生产加工有着重要意义。机器人搬运生产线配置有用于捡取或放置的多自由度机器人作为具体执行机构;配置一条或多条传送带用于输送工件;配置工业视觉系统用于工件的定位、识别、尺寸测量等。传送带上输送的工件按一定到达率随机到达机器人的捡取范围,机器人根据工件位置分布和机器人抓手空余量,按照一定调度策略决策应采取等待、捡取或放置操作。因此系统的优化目标是找到一个最优调度策略,使得系统长期运行情况下综合代价最低。本文以传送带走过一个工件长度所需的时间作为系统节拍,以机器人抓手空余量和工件分布信息作为状态,首先建立了机器人搬运生产线的离散马尔可夫决策过程模型,并分别采用理论优化和仿真优化的方法,即策略迭代算法和基于模拟退火的Q学习算法对该离散马尔可夫决策过程模型求解。然后对该模型和方法进行了分析和讨论,并根据仿真结果得到了系统运行最优参数。为了能够对实际生产加工中的机器人生产线进行更好的实验研究和模拟,本文还设计了一种机器人自动化生产线实验平台,该实验平台包括机器人系统、传送带输送系统、视觉系统、气路系统、人机交互集中控制系统以及智能环境支持系统,能够实现工件信息的获取、工件的自动捡取和放置、载件盒在传送带上的循环输送。为实验室对机器人生产线不同工作模式和控制方法的模拟、研究提供了实验手段。