面向机器人抓取的物体形状补全与6D位姿估计方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:feijin4fhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在三维视觉感知技术的推动下,新型智能机器人逐渐具备了越来越强大的感知和交互能力。基于视觉感知的机器人抓取技术主要分为已知目标物体模型的抓取和未知目标物体模型的抓取。对于未知目标物体模型的视觉抓取,抓取算法需要尽可能地感知物体的完整信息。然而,受到物体遮挡和扫描误差的影响,单帧RGB-D图像中包含的物体信息往往不够完整并且存在一定的噪声,这给机器人的精准抓取带来了一定的挑战。而对于模型已知的物体,需要首先预测出物体的6D位姿,并根据物体的模型得到机械臂的抓取位姿。虽然现有方法能够在桌面物体位姿估计数据集上达到了较高的准确性,但在无纹理数据集上的性能表现还有待提高,这是由于无纹理物体集缺乏纹理特征,难以从RGB图像中提取有效的物体特征。针对以上两个问题,本文分别提出了面向机械臂抓取的物体形状补全和6D位姿估计方法。首先,针对未知物体模型的机械臂抓取,本文提出了一种基于对称检测的物体形状补全方法Symmetry Net,采用单帧RGB-D输入,通过多任务学习来同步地预测物体的对称对应点(symmetry counterpart)。本文通过实验验证该方法具有较好的泛化性,能够在未知实例(holdout instance)、未知类别(holdout category)上进行有效地预测,与现有的相关方法相比性能最优(state of the art)。该方法在轻度、中度和严重遮挡下的数据集上进行了测试验证,实验证明相比于其他方法,Symmetry Net能够有效地克服遮挡。此外,本文还提出了针对物体对称预测和形状补全的评价标准并发布了相关数据集。其次,针对已知物体模型的机械臂抓取,本文提出了一种基于过分割结构分析的无纹理物体6D位姿估计方法Patch Fusion。该方法采用单帧观测的物体点云作为输入,通过过分割的方法提取物体的几何平面和曲面块(patch),并利用点云特征提取网络来对物体的局部特征进行学习,提出共面损失(coplanarity loss)和空间一致性损失(spatial consistency loss)来对位姿预测网络进行约束和监督。该方相比于传统的点对特征的方法,该方法具有更好的实时性;相比于基于深度学习的单帧RGB-D图像输入的方法,该方法具有更好的预测准确性;相比于单帧RGB图像输入的方法,达到相同的性能时该方法训练代价更小,数据需求量更低。
其他文献
基于语音对阿尔兹海默病进行识别被证明是一种有效的方法,相较于脑影像和量表,语音更具有经济性和可扩展性,能够适应大规模检测。目前的研究方法较多的采用降维-分类的方式进行,即将语音(通常在10万维以上)表示为低维的特征向量(通常在100维以下),再进行分类获得疾病识别结果。在特征表示方面,研究人员尝试使用局限性更小的内容无关(Content-independent,CI)特征来表示语音,但是传统的特征
学位
近似最近邻搜索是信息检索技术中的一个基本课题,在数据库、推荐系统等领域应用广泛。与精确最近邻搜索算法相比,近似最近邻搜索算法内存占用较小,同时牺牲较小的查询召回率,从而达到极快的查询速度。基于图的近似最近邻搜索算法是最常用的近似最近邻搜索算法之一,相对于基于空间划分、基于哈希和基于量化的算法,因其查询速度快、查询召回率高而被各大商业公司广泛应用。基于图的搜索算法的目标是构建高质量的图索引结构,通过
学位
人工智能模型的训练依赖于大规模高质量的标注数据。通过人工标注的方式可以获取高质量的训练集,但是人工标注效率很低并且代价高昂,尤其对于标注难度较大的文本语料,人工标注很难获取大规模的标注数据。远程监督可以用来自动构建大规模的标注数据集,然而通过远程监督得到的训练集质量并不高,训练集的质量决定着模型的上限,因此如何优化远程监督数据集已经成为当下研究的热点。远程监督在不同场景下面临着不同的问题,其解决方
学位
针对永磁同步电机在弱磁运行过程中因参数变化导致的控制性能下降问题,提出了一种采用单q轴电流调节器的多参数自适应补偿控制策略,以提高电机在弱磁区域内的转矩控制精度。实验结果表明该方法对参数的辨识误差在5%以下,输出转矩与期望转矩的误差小于1%,该方法能有效地抑制多参数变化对电机性能的影响。
期刊
随着无线传能技术的快速发展和无人机在各个领域的广泛应用,利用微波无线传能为飞行中的无人机提供能量保障已成为延长无人机工作时间的有效途径。考虑到微波点对点直接传能在无人机供电方面存在局限性,本文针对面向无人机供电的微波无线传能链路进行建模与优化研究以在一定程度上提高无人机微波无线供电的环境适应性、传输效率和实际应用价值。首先,本文对微波无线电能传输技术原理及其在无人机供电上的应用进行分析,针对面向无
学位
面部表情是人类情感信息传达的重要载体,在人们的沟通交流中发挥着重要作用。随着人工智能的迅速发展,让机器理解人类的情感具有重要的研究意义和实际应用价值。依托课题组视频动作识别与智能分析项目,本文研究基于卷积神经网络的人脸表情识别方法,并应用于课堂教学表情识别系统,协助教师对学生学习状态进行实时了解和事后分析,从而帮助提升教师教学质量。本文的主要研究内容如下:(1)针对轻量级网络Mobile Net
学位
近些年,无人机的广泛应用对空域资源提出了更多的需求,无人机的运行空间将逐步由隔离空域向融合空域扩展,保证飞行安全是将无人机集成到国家空域管理系统的前提。感知与规避(Sense and Avoid,SAA)是实现无人机自主飞行安全的关键技术,设计无人机感知与规避系统时,如何配置和融合使用感知传感器是无人机实现空域信息获取的重要环节。本文首先研究了针对不同任务环境的无人机SAA系统的感知传感器配置算法
学位
人们在浏览电商网站或购物软件上的服装产品时,往往会产生多样化的检索需求,如希望找到在某些服装属性上与查询图片相似的服装,以及希望改变查询图像某一服装属性而保持其它服装属性不变的需求,即服装属性操作,这些需求即为细粒度服装图像检索,当前的搜索引擎对这些需求还无法很好的满足。针对以上的检索需求,需要提取图像与服装特定属性准确相关的特征,深度学习的发展使得这一操作成为可能,本文基于深度学习理论深入研究了
学位
关系抽取意在抽取文本中实体对的关系,对于知识图谱的构建起着重要作用,是自然语言处理中重要任务之一。关系抽取面临着诸多挑战,尤其是复杂语境和学习能力带来的文档级关系抽取以及少样本关系抽取问题。本文重点研究了针对上面两个问题现阶段的工作以及存在的不足并进行了相应的改进。我们发现以下几个不可忽视的问题:1)现阶段的文档级关系抽取模型一般只从单方面捕获信息;2)文档级关系抽取模型或者是依赖于外部解析器构造
学位
针对城市轨道交通X射线安检危险品识别,在YOLOv5m基础上,增加了CBAM注意力,分别对通道和空间的特征进行操作。经过实验验证,该方法的mAP50:95、mAP50分别提升了0.6和1个百分点,结果表明改进后的算法能显著提高检测精度。
期刊