基于情景记忆和元学习的机械臂运动技能获取

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:cjh3134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类从出生到老去可以一直的学习和积累知识,并能够对学习到的技能进行存储记忆,实现有效的重复利用知识以快速解决新任务的。研究机器人技能的学习方法,使其在学习过程中掌握完成任务所需技能,记住训练过任务中经历过的多个片段,并能够进行整合应用到新任务中。本文分章节开展了基于情景记忆和元学习的机械臂运动技能获取研究,研究内容主要从以下几个方面展开:首先,设计了物体识别定位和操作系统(Object recognition and grasping system),通过视觉实现对工作空间内物体的识别和无碰撞操作。通过对相机标定后获取物体的点云信息,实现物体的定位;搭建基于RGB-D图像的视觉系统,分别实现简单环境和复杂环境下的物体识别。基于Move It!运动规划库进行机械臂的路径规划,并针对任务常用基础动作进行设计。然后,开展了基于元学习的机器人学习技能的方法研究。采用了LSTM为核心搭建的元学习网络。通过机械臂在多个任务上的训练进行跨任务学习,在模型训练阶段,元学习器针对技能获取目标设置多组任务进行训练,对每个任务基础学习器学习当前任务,掌握当前任务,由LSTM搭建的元学习器接收元分类器传递的梯度信息,元学习网络训练完成后,通过建立的情景记忆模型将网络参数存储为经验模块,指导元分类器在新任务的学习。再次,通过研究情景记忆的生物学基础和认知特性,对情景记忆功能进行分析,构造包含机器人经验和技能模型的情景记忆。将每个任务的情景记忆建模为多个事件的集合以及元学习器对于该任务的网络权重。在低层次,针对任务的每个事件封装机器人对该事件的状态感知以及行为动作;在高层次,针对每个任务封装该任务元学习器的网络权重作为情景经验存储。最后搭建由Kinect V2摄像头、UR3e机械臂、移动操作平台、robotiq二指夹爪等构成的机器人实验平台,设计桌面混杂物体清理任务、木块堆叠等任务,通过示教操作机器人与物体交互学习抓取、堆叠等简单技能;然后通过木块堆叠任务构型变化任务、混杂物品分类任务验证模型在复杂任务上的泛化能力。
其他文献
模糊认知图是一种由概念节点和连接概念节点的加权有向弧组成的有向图模型,它结合了模糊逻辑和神经网络的思想,具有强大的知识表示和推理能力,主要用于复杂动态系统的建模和分析。如何利用历史数据自动学习模糊认知图的权值是当前模糊认知图研究的重点。目前,基于历史数据的模糊认知图的权值学习通常分为三类:基于Hebbian的学习方法、基于种群的学习方法和混杂型学习方法。这些学习方法已经被应用到许多领域,表现出了良
“中国制造2025”规划中明确提出发展高端数控机床,因此对数控机床的高精度的设计需求愈发急切。机床振动特性影响着工件的加工精度,振动大多发生在可动结合面,机床可动结合面又以滚动导轨副为联接的移动结合面为最为常见,因此对滚动导轨副振动性能的研究具有重要意义。滚动导轨副振动误差的研究未考虑导轨几何误差对振动响应的影响,导轨几何误差改变了导轨副接触角与接触变形量的变化,影响导轨副接触刚度,进而对滚动导轨
当今社会劳动力成本越来越高,而现阶段机器人无法完全代替人力进行生产,在一些精细化操作中人工生产模式仍占主导地位,为了降低劳动强度、提高生产效率,人机协作的生产模式应运而生,而如何确保人与机器人的近距离安全共存是此模式下亟待解决的问题,也是近年来机器人领域的研究热点。因此,本文以自研的七自由度机器人为研究对象,对碰撞检测和柔顺控制等关键技术展开研究。机器人动力学模型是碰撞检测及柔顺控制算法的理论基础
在机械零部件制造加工行业中,铸造件内部缺陷检测是生产质量检查的关键一环,而目前,多数铸造加工厂仍然存在使用人工观察DR(digital radiography)图像来检查缺陷的方式。这种方法效率低下,且经常因人为原因造成漏判,效果不佳;随着计算机技术的发展,越来越多的研究人员使用计算机算法代替人工检测。然而,传统的计算机视觉方法普遍缺乏准确性和鲁棒性。为了解决如上问题,提高铸造件DR图像缺陷检测的
隧道掘进机(TBM)的应用已成为当下主流的隧道施工方式。而在掘进过程中,刀具在破岩时逐渐磨损,影响掘进效率,因此,更换磨损的刀具成为了施工过程中不可或缺的任务。目前,人工换刀效率低、风险大的弊端,引起重视;“机器代人”换刀成为了研究的热点。国内外机构对此进行了广泛的研究,提出了多种换刀机器人方案,但在物理实验和工程应用上取得进一步进展的较少。本文基于7.8m直径的TBM换刀机器人搭建了缩尺物理样机
金属零部件在复杂的工况条件下,如高温高湿、冲击、振动以及大负载等,很容易在零部件表面产生各种微小的裂纹。如果不能及时发现而任由其不断扩展,会引发严重的安全隐患,甚至造成严重的安全事故。激光超声作为一种新兴的超声无损检测技术,凭借其独有的优势,在无损检测领域展现出良好的应用前景。在目前主流的检测方法中,实现对表面裂纹的判别主要依赖于使用多种信号处理手段从超声波的反射以及透射波信号中提取出相关的时频域
目的分析抑郁症患者功能性消化不良(FD)、肠易激综合征(IBS)以及FD合并IBS的患病情况。方法选取2020年7月-2021年2月安徽医科大学附属巢湖医院收治的抑郁症患者200例作为观察组,另选取同期在我院进行体检的健康人群200例作为对照组。研究对象均进行问卷调查,比较两组FD、IBS、FD合并IBS的患病情况,观察组中不同性别FD、IBS、FD合并IBS的患病情况,以及观察组中有无胃肠道症状
随着当前社会人口老龄化趋势的不断加剧,由于脊柱损伤、脑卒中、脑血栓等中枢神经系统疾病引起的下肢运动功能障碍患者的人数不断上升,患者对于重新行走的渴望日益强烈。下肢助行外骨骼机器人作为智能机器人技术与康复医疗理论相结合的新产物,可以通过为不同身体状况的患者提供正确合理的助行方案,帮助患者完成日常生活中的行走动作。国内外科研机构对下肢助行外骨骼机器人进行了大量研究,提出了很多行走规划方法,但应用场景只
激光熔覆在增材制造技术中应用广泛,常用在零部件直接成型以及复杂零件修复等领域。激光熔覆中大多数的应用都需要多层堆积加工,而加工件的质量与离焦量息息相关。在加工过程中,由于熔池温度与累积误差等原因,会使得熔覆层的高度处于不断变化中从而导致离焦量的变化,因离焦量的不稳定易导致熔覆层组织性能不稳定,而造成最终工件质量不佳。因此,为在加工复杂零件如环形件或梯度材料时,可以获得尺寸精度较高的熔覆层,需要对离
随着国内网球运动的普及,更多人喜欢上这项运动,但是网球训练者要背负繁重的捡球劳动,同时市场上又缺少相关的解决方案。本文通过研发一款服务机器人代替运动员进行网球自动拾取。针对网球拾取实际工况,结合移动机器人开发特点,网球机器人需要具备稳健高效的控制系统软、硬件和稳定可靠的机械结构。在网球机器人控制系统软件方面,分析了FreeRTOS嵌入式实时系统的多任务架构;基于多任务管理与调度原理以及系统裁剪与移