论文部分内容阅读
多年来,机器人感知是一个重要的研究领域,其中计算机视觉在机器人的环境感知方面发挥着重要作用。基于视觉反馈的机器人控制称为视觉伺服控制。为了提高视觉伺服控制的技术水平,使其能够在工业场景中稳定地应用,有关学者进行了各种各样的尝试。然而至今为止,在实际复杂的工业环境中对视觉伺服进行深入研究的案例很少。本文基于大量实验,介绍了计算机视觉和视觉伺服算法在需求广泛的工业场景中的应用。首先,本文研究了基于位置的视觉伺服的汽车零件喷涂机器人的设计方法。本文采用了点云处理的方法,使其能够实时感知各种类型的几何图形。结合降维的方法,将三维点云投影到二维平面子空间上,并运用轮廓搜索等二维图像处理的方法。本文提出了一种改进的特征提取方法,该方法使用扇形模型从汽车零件的二维图像中提取有用的特征。本文采用统计匹配的方法从有限集合中识别出汽车零件,并与目前点云处理中广泛使用的目标识别方法进行计算成本比较。比较结果表明,相比其他目标识别方法中的特征提取方法,该算法具有更好的实时性。在姿态估计部分,本文采用了著名的迭代最近点算法,将其与遗传算法相结合,解决了其收敛于局部最优的问题。与传统的迭代最近点算法相比,改进后的算法降低了姿态估计误差,具有更好的性能,对于优化漆膜厚度和基于视觉的控制至关重要。另一个实际工业场景是电信行业中射频拉远单元的质量检查。现代工业标准对自动化系统的鲁棒性和实时性有着严格的要求,为了满足这些要求,本文对基于图像的视觉伺服系统进行了详细的研究。鉴于计算机视觉是视觉伺服控制的重要组成部分,本文设计了一种从图像流中视觉识别遥控无线电单元电源端口的算法。基于图像的视觉伺服依靠对感兴趣区域的连续跟踪来生成控制指令,本文根据轮廓搜索的方法,研制了一种可靠的6自由度目标跟踪器。与目前最先进的均值漂移跟踪器相比,该算法在计算量几乎相等的情况下具有更好的性能。接着,本文选择了一个与机器人自由度相关的集合来选择图像特征,该集合中所有成员都是唯一对应的。此外,本文还推导了无深度图像雅可比矩阵,将图像特征加速度与运动摄像机的特征加速度联系起来,利用变结构控制理论进行了控制设计。本文构造了PD型控制律并将设计参数降为一个,用Lyapunov稳定性分析证明了该控制律的稳定性。最终,在实际系统上实现所设计的基于图像的视觉伺服算法之前,对其稳定性进行了数值模拟;之后在带有移动摄像机装置的工业机械臂上实现了该算法,通过实验证明了研究结果,验证了所设计算法在工业场景中的鲁棒性和适用性。除了对经典视觉伺服方法的实验研究外,本文还结合现代人工智能技术对其进行了研究。深度学习已经使计算机视觉领域发生了革命性的变化,它是视觉伺服系统的重要组成部分,因此研究这一领域的进展具有重要意义。本文将深度神经网络应用于机器人关节空间单目视觉伺服控制中。基于位置的伺服系统一般需要在机器人的笛卡尔坐标系下进行控制,而笛卡尔坐标系下的控制又需要进行正运动学和逆运动学的分析。本文提出了用深度神经网络作为回归函数逼近器的方法,它不仅可以估计机器人的逆运动学,而且可以估计对控制性能具有极大影响的摄像机内外参数。在实际应用中,实时估计这些参数计算成本高而且十分困难,在这方面采用基于数据的方法很方便,并且具有良好的鲁棒性。针对训练数据集的生成问题,本文构造了一种自动生成训练数据的方法,该方法可以生成数千个训练样本。网络训练采用了领域自适应和转移学习的方法,并对训练前的网络模型进行微调,使之适用于射频拉远单元的质量检测。相比从零开始的网络训练,该方法需要的数据更少。本文对最新的Pose Net进行了改进,并用网格搜索法寻找其最优超参数,比较了Pose Net与Alex Net的性能,最终在带有移动摄像机的工业机械臂上实现了改进的算法。最后,本文探讨了直接视觉伺服任务的强化学习思想及其实现,采用连体深层神经网络来建立可靠的稀疏奖励模型。本文研究了领域自适应和转移学习的方法,并对已有的数据集生成算法进行了改进,采用VGG16深度神经网络的预训练权值作为图像特征提取器,在Alex Net的基础上设计后续的网络层。通过严格的实验,本文得到了网络的最优化结构,同时进行了大量的超参数整定。结果表明,该方案不仅在远程无线单元质量检测中得到了很好的应用,而且在任意场景下也能得到很好的应用。此外,本文还对基准数据集的性能进行了检查。最终,采用经典的关键点匹配方法对生成的数据集进行了性能比较,结果表明该方法很好地解决了视觉伺服系统的深度强化学习中的场景识别问题。本文的工作为理解和实现直接视觉伺服中的深度强化学习奠定了未来研究的基础,随着这项工作的开展,视觉伺服中的场景识别技术的设计难度大大地降低了。