多模态信息融合的机器人位姿估计方法及应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:ythaohaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前工业机器人已广泛应用在智能制造领域,其中机器人位姿估计是工业应用中最常见的任务需求之一。在工业现场主要通过机器视觉实现简单场景下的机器人抓取位姿计算和物料分拣。随着工业控制对精确度和自动化要求的日益增长,传统的视觉位姿估计方法已不能满足日益复杂的任务场景与需求。在复杂工业应用场景中,待抓取的物体往往存在相互堆叠、交叉干扰、边缘模糊、噪声等问题,使工业机器人难以获取对于被测物体的准确抓取位姿。因此,如何在复杂工业场景中,实现工业机器人准确、高效的位姿估计已成为新的研究热点。本文根据复杂工业场景的特点,在工业机器人位姿估计方面进行了深入研究,通过二维视觉信息和三维点云信息对机器人位姿进行引导,提出一种基于多模态信息融合的机器人位姿估计方法,主要工作内容如下:1.提出一种完整且高效的3D姿态数据集制作方法。该方法可以在短时间内完成待识别物体的姿态标注,为位姿估计任务提供可靠的数据。并通过QT软件开发框架建立该系统的基本软件架构,实现数据集的全自动采集与构建。2.提出基于改进Mask RCNN二维图像信息提取方法。首先采用Dense Net密集连接网络对特征提取层进行优化,增强弱特征的提取能力,然后通过引入建立新的分割损失函数,使图像中物体信息的提取更加准确。改进后的Mask RCNN网络可以为位姿估计网络提供待抓取物体准确的RGB信息和深度信息。3.搭建了基于多模态信息融合的位姿估计网络。通过Mask RCNN模块的输出的结果分别对场景中的待抓取物体进行RGB信息和深度信息的提取,并将深度信息转换成相机坐标系下的点云信息。使用Dense Net和Point Net++分别对RGB信息和点云信息进行特征提取,再利用特征融合网络对异构特征信息进行像素级特征融合,最后通过位姿回归网络和ICP算法实现相对位姿的旋转四元数估计以及四元数至旋转参数矩阵的解析,位姿估计误差在8度以内。4.研究了多模态信息融合的机器人姿态估计算法在实际工业场景的应用。首先介绍了手眼标定方法,并对Eye to hand手眼标定方式进行了理论推导。分析了工业机器人的运动规划算法,利用MATLAB和Mathematica实现了对机械臂RRT运动规划算法的仿真。最后将本文提出的位姿估计算法应用在实际工业场景中,实现了复杂工业场景下的工业机器人的抓取应用。
其他文献
随着人工智能技术的蓬勃发展尤其是以深度学习为代表的基础理论与工程实践的突破,智慧城市及安防相关产业也出现了跨越式发展,其中一个重要应用是智能视频监控系统。监控视频中的异常事件检测又是其中一个非常重要但是非常困难的任务,近期已经有非常多的方法被提出来解决这个问题。之前的方法要么只考虑单方面的外观或运动信息,要么仅仅只是在测试阶段直接整合外观和运动信息的决策结果而不考虑这两个模态内在的一致性关联语义。
随着微机电系统(Micro Electro Mechanical System)技术的发展和微机械加速度传感器制造技术的成熟,微机械加速度传感器得以广泛应用于汽车安全控制和自动导航定位系统、机器人轮廓跟踪和运动控制、电子产品防摔和人体行为识别等诸多领域,研究微加速度传感器显得尤为重要。四悬臂梁压电式加速度传感器相较于传统的单臂和双臂结构的压电传感器而言,灵敏度高、稳定性好、横向效应和噪声低,具有动
随着物联网、5G和人工智能(Artificial Intelligence,AI)的飞速崛起以及高度融合,衍生出了一批又一批基于物联网的新型智能边缘应用(例如,智慧城市、智能安防、无人智能驾驶等)。然而,面对海量零散分布且消耗大量通信计算资源的智能边缘设备,如何提高能效以及创新供能方式成为制约智能边缘发展的瓶颈,如何巧妙联合通讯计算资源设计在降低智能边缘终端设备因模型训练而产生的巨大能耗的同时保证
互联网时代的今天,随着信息技术的发展,互联网的数据正在以前所未有的速度增长,这些数据还具有多样性,存在形式可能是图像、文本、音频、视频等等。然而,在大数据时代的今天,庞大的数据集和多彩多样的图像内容也给图像的有效检索带来了挑战。如何有效地提取具有丰富语义信息的高分辨率图像的特征,如何构造更好的损失函数来很好地保留相似性图像的语义信息,鉴于进行线性扫描的时间成本是非常巨大的,那么在大规模的数据集当中
车联网作为5G、交通和汽车领域跨界融合且最具潜力的应用,已成为我国战略性新兴产业的重要发展方向。道路安全、交通效率、自动驾驶和信息娱乐等各类车联网应用提出了低时延、高可靠、大带宽、高移动性等新的移动通信需求与挑战。本文主要解决车联网中的三个关键挑战:如何确保与交通相关的数据安全?随着移动互联网数据流量激增,如何保证车联网数据安全、可靠、稳定传输?如何利用有限的存储空间设计高效的缓存策略?本文主要聚
乳腺癌的发病率在女性癌症中位居首位,占所有新确诊癌症的30%,是威胁女性健康的头号敌人。淋巴结的转移状态是乳腺癌最重要的预后因素之一,及时、准确地检测腋窝淋巴结转移状态对指导乳腺癌的临床治疗至关重要。腋窝淋巴结清扫是临床检测的金标准,但它是一种有创的手术方式,会导致诸多术后并发症,例如淋巴水肿、血清瘤和感染性神经病变等,并且会让乳腺癌早期患者过度治疗。腋窝超声检查是一种应用于乳腺病变患者腋窝淋巴结
物理层安全是实现无线通信安全的一个关键技术,也可用于实现无人机(unmanned aerial vehicle,UAV)通信的信息传输安全。以无人机为空中移动基站,可以实现远距离通信更稳定的信息安全传输,同时也可以提高无线通信系统的通信质量和覆盖范围。然而无人机基站在和地面合法接收者通信时,由于无线通信具有广播开放的特性使得通信质量提高的同时也提升了窃听者接收到信息的强度,增加了通信过程中的安全隐
虚拟实验是一种模拟的交互式学习环境,允许学生完成实验室实验和理论的学习,而无需进入到实验室中。从空间角度区分,虚拟实验分为二维虚拟实验和三维虚拟实验,无论是感官体验还是表现形式上,三维虚拟实验更具空间感、更立体以及具备实时交互性、沉浸感高、构想性强等优点,是近些年来的热门研究方向。在虚拟世界的实验教学可以提高实验学习者的学习效率,但在人机交互方面还依旧采用鼠标、键盘等传统人机交互方式已经无法满足新
随着人们生活水平的不断提高,对汽车智能化水平提出了更高的要求。高级驾驶辅助系统随之出现,经过多年的发展,高级驾驶辅助系统已经形成了由多种传感器组成的复杂信息采集系统,毫米波雷达则是该系统的重要组成部分。由于毫米波雷达具有体积小、成本低、雨雪天气影响小等优点,受到各大汽车厂商和科研人员的广泛关注。目前,在汽车领域主流毫米波雷达分为24GHz和77GHz两个频段。24GHz频段雷达频率较低、波长较长,
随着科学技术的日新月异,大数据、物联网、云计算、人工智能等信息技术领域的得到了空前的发展。随之而来的是数据的快速“膨胀与变大”。这给身处在这个信息时代的我们带来了巨大的机遇和挑战。机遇在于若能恰当利用数据中的信息,我们定能神机妙算,事半功倍;而挑战在于我们如何恰到好处的从大量庞杂的信息中提取到我们需要的那一部分关键信息。数量大、维度高,是当前数据的普遍特点,我们在对其进行数据分析时往往耗费大量的时