论文部分内容阅读
随着机器人技术在复杂现实场景中的广泛应用,人们希望借助机器人灵巧手去完成一些危险、重复及难操作的工作,这对机器人灵巧手提出了灵活性、智能性、易控制性等要求。灵巧手的抓持动作分类是机器人灵巧手抓持规划过程中的一个重要环节。因灵巧手具有较多的自由度和抓持模式的多样性,对不同物体适用的抓持动作进行预测具有一定难度。本文利用深度学习技术,从图像中提取被抓持物体的特征,找出由图像到灵巧手抓持动作的映射关系。为了在复杂环境下实现对物体抓持类型的准确判断,借鉴人类抓持物体的特点,结合图像分割和深度学习技术,设计和实现了一个能对抓持不同物体时的抓持类型进行预测的灵巧手抓持分类器,并在仿真环境下验证了该分类器的性能。本文主要工作内容如下:(1)针对灵巧手在抓持复杂环境中的物体时使用神经网络难以准确提取物体特征的问题,利用结合超像素SLIC的Grab Cut分割算法把被抓持物体从复杂的环境中提取出来。为了提高被抓持物体图像的分割效果,在SLIC算法中使用闵可夫斯基距离代替欧氏距离来描述两点间颜色相似度测度,同时在SLIC的距离测量公式中引入颜色权值和空间权值,改善超像素产生的效果。通过实验对比,使用改进后的分割算法分割出来的被抓持物体图像更加准确。(2)设计了一个基于改进Shuffle Net网络的灵巧手抓持分类模型,用来预测灵巧手的最佳抓持类型。在国内深度学习开源框架Paddle Paddle下搭建并训练Shuffle Net网络,结合SE-Res Net模块对网络进行改进,优化了网络提取的特征,有效提高了模型分类的准确率。针对抓持数据集不平衡的问题,使用焦点损失函数代替传统的交叉熵损失函数对模型进一步的优化。实验分析表明,使用焦点损失的改进Shuffle Net网络模型的分类性能最佳,且模型大小仅有11.3M,易于在中小型嵌入式系统中部署。(3)由于目前实体灵巧手受成本、实验环境等限制,本文基于ROS系统搭建灵巧手抓持仿真平台。利用数据集对设计的灵巧手抓持分类器进行验证,结果表明,去除背景后的物体图片可以有效减小复杂背景对识别精度的影响。在仿真平台上进行仿真测试,测试结果表明,使用抓持分类器可以较准确地得到符合人手抓持习惯的灵巧手抓持类型。仿真测试结果验证了灵巧手抓持分类器的可用性。