【摘 要】
:
传统的机器人抓取方法对于重复性的固定任务鲁棒性很好,但是难以适用于那些需要机器人具备自学习能力的智能化控制场景。深度学习、深度强化学习技术的快速发展为机器人的智能化控制提供了新思路。近年来,国内外学者对基于学习的机器人智能化控制技术进行了大量的研究,但是,基于学习和视觉反馈的机器人端对端伺服控制仍旧是一个极具挑战性的任务。本文基于深度卷积神经网络和自适应协方差进化策略算法(CMA-ES),实现了在
论文部分内容阅读
传统的机器人抓取方法对于重复性的固定任务鲁棒性很好,但是难以适用于那些需要机器人具备自学习能力的智能化控制场景。深度学习、深度强化学习技术的快速发展为机器人的智能化控制提供了新思路。近年来,国内外学者对基于学习的机器人智能化控制技术进行了大量的研究,但是,基于学习和视觉反馈的机器人端对端伺服控制仍旧是一个极具挑战性的任务。本文基于深度卷积神经网络和自适应协方差进化策略算法(CMA-ES),实现了在单目视觉的情况下,对机器人抓取行为的端对端伺服控制。在伺服机制的控制下,机器人可以通过单目图像的反馈连续地调整抓取姿态,最终到达一个更好的抓取位置。首先,分析了伺服控制任务中的映射问题,基于残差单元,搭建了一个深度卷积神经网络,以实现任务空间中单目图像、运动指令到机器人抓取成功概率的映射,并对预测模型的时间复杂度和空间复杂进行了分析。训练后该预测网络能为机器人姿态的调整提供启发性的反馈信号。其次,为了训练抓取成功概率预测模型,搭建了基于视觉的机器人实验平台,设计了训练数据的采集实验,并让机器人在3个多月的时间内进行了4万多次的抓取尝试,总共采集了18万个训练样本;通过使用带权重的交叉熵损失函数和多个性能评价指标,解决了正负样本严重不平衡的情况下预测模型的训练难题;基于GBP算法对训练后的预测模型进行了可视化分析。然后,将搜索最优运动指令的过程建模成一个带限制条件的黑箱优化问题,基于CMA-ES算法和训练后的预测模型,提出了最优运动指令的搜索算法;通过一个决策规则的引入,解决了机器人在当前状态下是执行最优运动指令进行姿态调整还是在当前位置进行抓取的决策问题,实现了对机器人连续地伺服控制。最后,基于提出的算法建立了一个机器人抓取系统,并设计了实验评估方案。实验结果表明,系统对于训练集中的物体能达到70%多的抓取成功率。
其他文献
作为新一代信息技术与制造技术的融合,智能制造是未来制造业的发展变革方向,是山东省新旧动能转换的重要实施环节。大力发展智能制造技术,有利于传统生产设备的升级改革,改变
【摘要】疫情形势下,高校思政工作面临着严峻的考验,如何将传统的思政教育顺应形势转化为“云思政”,这是我们要思考的问题。在运用腾讯会议、钉钉等新媒体软件进行网络思政教育的同時,如何应对所产生的问题,也是线上思政工作的重点。 【关键词】新媒体;网络思政 疫情期间,很多高校思政工作由线下转为线上,本文分析了利用新媒体开展思政工作中存在的问题,并提出了相应的措施。 一、目前利用新媒体开展思政工作存在
体育赛事在全球如火如荼地开展着。物流是赛事的一个重要环节,甚至是影响比赛举办成功与否的关键环节之一。为了更好地开展赛事物流工作、促进赛事物流健康有序发展,通过对赛
蔡梦霞,1972年生于广西南宁,祖籍江苏泰州。系中国书法家协会会员。1989始,师从黄泓、陈国斌、张羽翔诸位先生学习书法、篆刻,1993年考入中国美术学院国画系书法专业,1997年毕业并
你是否也遇到过以下不愉快的经历?当你在茶馆悠闲地品茶时,有人滔滔不绝地高谈阔论;当你在餐厅安静地吃饭时,有人旁若无人地大声喧哗;当你在书店聚精会神看书时,有人大声嬉笑
考虑了在既拥有传统零售渠道又拥有网络直销渠道的双渠道供应链中,2种决策方式下通过不同销售渠道发起团购对供应链最优决策的影响.研究表明:集中决策下,在市场份额较大的渠道
<正>有位教育专家说过,三流的学校是校长治校,二流的学校是制度治校,一流的学校是文化治校。文化治校是学校管理的最高境界。作为威海市环翠区AA特色学校,文化治校、文化立校
随着股权的进一步集中,上市公司大股东与中小股东的利益冲突已成为公司治理的焦点。因此,理论界对尽快约束大股东"掏空"行为的呼声很高,也做了一系列的研究。本文将从股权制衡
良好学习习惯的培养必须以学生健全人格的养成为目标取向,必须树立尊重环境变化的意识,在尊重环境复杂性和多样性的过程中培养儿童适时辨析环境性质的思维习惯,在尊重儿童真