【摘 要】
:
机械臂技能传授一直是人工智能领域的研究热点之一,现阶段的技能传授方法主要通过三维重建技术搭建虚拟空间对机械臂进行模拟训练。但现阶段的重建方法计算流程繁琐,重建误差大、时间长,环境适应差。此外,现阶段的重建方法还存在构建的虚拟空间与真实世界物体尺寸不同和人与机械臂观察视角不同等问题,导致在虚拟空间内的抓取技能难以转化为机械臂在真实世界中的现实操作。针对以上问题,本文提出了一种面向机械臂操作的视觉信息
论文部分内容阅读
机械臂技能传授一直是人工智能领域的研究热点之一,现阶段的技能传授方法主要通过三维重建技术搭建虚拟空间对机械臂进行模拟训练。但现阶段的重建方法计算流程繁琐,重建误差大、时间长,环境适应差。此外,现阶段的重建方法还存在构建的虚拟空间与真实世界物体尺寸不同和人与机械臂观察视角不同等问题,导致在虚拟空间内的抓取技能难以转化为机械臂在真实世界中的现实操作。针对以上问题,本文提出了一种面向机械臂操作的视觉信息重建方法,研究工作主要内容如下:(1)针对当前三维重建方法计算流程繁琐、环境适应差的问题,提出了一种基于深度学习的视觉空间和操作空间映射方法DL-VOM。首先使用单个RGB-D相机进行视觉信息采集,之后利用卷积神经网络对视觉信息进行特征提取,最后将提取到的特征值经过全连接后计算得出所对应的机械臂操作空间三维位置信息。实验表明,该方法仅需使用单个RGB-D相机及卷积神经网络即可完成映射,简单快捷,误差约为15mm。(2)针对当前三维重建方法重建误差大、时间长的问题,提出了一种基于DL-VOM单目视觉三维实时重建方法DL-3D。首先通过Mask R-CNN网络对单个RGB-D相机实时采集的视觉信息进行提取,之后使用DL-VOM方法将提取到的视觉信息进行映射,最后提出了一种聚类簇中心距离受限离群值调整方法BCC-Drop用于减小重建误差,并通过Open GL搭建虚拟空间。实验表明,该方法重建速度可达16fps,重建绝对误差约为5.73mm,重建相对误差约为5.23%。(3)针对当前虚拟空间中的抓取技能难以转化为机械臂在真实世界中的现实操作的问题,提出了一种新型技能传授策略,建立了一个基于DL-3D的人机协同机械臂技能传授系统。在此系统中,我们通过记录虚拟对象的状态变化用于指导机械臂在真实世界中的运动规划。实验表明,该系统与传统系统相比在机械臂抓取技能传授任务中摆放位置误差减少约1.7%,摆放角度误差减少约2.1%,所消耗时间减少约3.6s。
其他文献
肺癌是一种发病率高且死亡率高的恶性疾病。作为肺癌的一种早期症状,肺结节的出现预示着肺部细胞正在逐渐发生癌变。肺结节一般为椭圆形或不规则球形,不同大小、形状、密度分布、生长速度的肺结节对应着不同的肺癌发病率,因此,针对肺癌的早期诊断,肺结节检测是一种有效的方法。利用计算机进行肺结节检测方法的设计与优化一直是各领域专家学者不断探索的方向,它能够缓解因医生人工分辨而带来的医疗资源紧张的问题。随着深度学习
从目前大同发掘出土的元代墓葬及壁画来看,以水墨山水特征为主的元代壁画与题材多样的辽金壁画呈现出完全不同的表现风格。大同地区墨色系壁画的流行与当时的绘画风格、宗教思想以及高压政权下的士人情感寄托有着必然的联系。墨色系壁画的出现与兴盛是汉族人士对世俗社会不公待遇的无声抵抗,也是他们表达内心愤懑情感的重要方式。
图匹配旨在建立两个图之间的结点映射关系,是一个经典的NP难组合问题。近几年,大量的研究者开始借助深度学习技术来构建端到端的可训练架构,以此对图匹配问题进行求解。这一端到端的管道架构被称为深度图匹配模型,其包含两个重要模块,图表示学习模块和图匹配问题求解器。然而,在目前深度图匹配模型研究中,存在着两个待解决的重要问题。第一,主流的深度图匹配模型通常对图匹配问题进行连续松弛,以使得模型可以基于梯度下降
基于核心素养视域下“深度学习”的内涵、意义以及初中化学学科“深度学习”与“发展核心素养”的关系,以“知识问题挑战性与驱动性、情境创设愤悱化与生成化、问题解决自主化与迁移化”的理念设计了“化学实验测定与探究”课例。阐释了以真实情境为主线、聚焦活动、方法指引、素养观照与评价导向五线融合的深度学习教学模式。
在当今大数据时代,数据高速无限产生,如何处理和存储海量数据成为一个巨大的挑战。数据源源不断地产生以及高速的特点,使得人类专家不能快速准确地给所有样本都打上标记。人工标记样本的代价十分昂贵且不切实际。因此,在真实的数据流环境中,往往只有少量标记样本和大量无标记样本,只使用标记样本训练得到的模型泛化能力低下,而且会浪费无标记样本的结构信息。同时,在数据流环境下,数据分布经常会发生变化,即在真实的数据流
食作为旅游六要素之一,在旅游活动中占有重要地位。信息技术快速发展为旅游业带来新的发展机遇,在线餐饮平台已经成为游客获取信息和表达观点的重要途径,在这过程中产生了大量评论文本。用户直接从海量数据中获取有效信息有很大难度,利用情感分析技术能够自动抽取评论文本中所蕴含的观点。通过对评论文本进行方面挖掘以及情感分析可以得到不同方面的情绪表达,为游客在陌生的旅游环境提供丰富的决策参考信息。本文基于餐饮评论文
在PPP项目中,政府和社会资本建立了伙伴关系,为实现风险共担、收益共享,双方针对股权比例分配和特许经营定价展开博弈。基于此背景,本文研究了在完全理性和考虑公平偏好两种情形下的博弈模型,既丰富了PPP股权结构博弈模型的理论研究,也为PPP项目双方的决策提供了管理学启示。本文首先,通过广泛的文献调研,梳理和总结了国内外学者对于PPP项目融资、股权结构及公平偏好的研究现状,表明将决策者的行为偏好引入股权
随着人类向海洋进军步伐的加快,人们日益习惯借助水下机器人(ROV)替代人工完成水下作业任务,例如水下搜寻与排查,水下领航以及海洋养殖捕捞等,但是水下图像存在色偏、模糊、背景复杂、目标生物尺寸变化大等问题,且ROV计算量有限难以部署大型模型,基于上述问题,本文主要围绕水下图像清晰化处理,水下目标检测,以及目标检测模型轻量化的技术难点开展研究:(1)水下图像清晰化处理。针对水下图像存在色偏、模糊、背景
随着新一代信息技术的兴起以及互联网产业的快速发展,数据量呈爆炸式增长。为满足数十亿用户从海量数据中快速获取有效信息的需求,提升搜索引擎的检索质量以及查询效率具有重要意义,同时也面临挑战。一方面,用户的查询词日益复杂,语言词汇形态变异的特点导致检索词变得多样化,而现有词干提取算法普遍存在词干提取不足、词干提取准确率不理想等问题;另一方面,在海量数据中检索到满足用户查询要求的文档结果是一项非常耗时的任
随着智慧城市快速发展,通过视频监控获取大量车辆图像数据及其处理是解决智慧城市中公共安全的重要途经,而大规模车辆图像检索是实现公安部门的案件侦查等应用的核心环节之一。然而,由于道路和卡口监控摄像头的广泛使用,车辆监控数据呈现爆炸式增长,且车辆图像自身特点的复杂多样性、更新速度快,导致从海量的复杂车辆图像中搜索出相似度较高的目标图像成为较大难题。比如,部分车辆图像在低光照环境中拍摄,导致车辆图像噪声大