基于RGB-D的物品分类及机器人抓取技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sfyaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前是一个智能化的时代,无论是对于传统的工业机器人,还是对于目前技术并不太成熟的服务机器人,都提出了新的挑战。而作为机器人的一项非常重要的能力,机器人的抓取及分类一直是国内外研究的重点。物体种类的繁多,物体形状的多变以及物体位姿的任意摆放,都对机器人的抓取及分类提出更高的要求。本文面对生活中常见物品分类及抓取,以Kinect v2相机为主要传感器,重点研究建立抓取分类模型学习物体的三维局部特征,根据局部特征映射到机器人末端的抓取参数;针对少量训练样本的情况,研究和分析两种经典神经网络的迁移学习进行物品的分类,并且搭建了实验平台进行最终的验证。本文的工作主要包含了以下几个方面:(1)为了实现生活中常见物体的识别和分类,研究和分析了两种比较经典的神经网络模型VGG16和Inception-v3的迁移学习。分析公共的数据集,进行一定的预处理,得到训练和测试所需要的数据集;针对原始数据集数量较少的问题,采用迁移学习的方法训练神经网络模型;对比两个模型在测试集上的测试结果,最终选取Inception-v3神经网络模型作为本文的物体分类模型;(2)为了获得机器人末端执行器的抓取参数,研究了四种抓取分类模型。分别针对颜色信息RGB、深度信息Depth、四通道的RGB-D信息、两个独立输入的RGB和Depth信息建立了四种抓取分类模型,对比和分析在已经标注完成的数据集上的测试和检测,最终四通道RGB-D抓取分类模型在top1矩形框的检测中获得了83.5%的成功率,明显高于本文中对比的其它模型;(3)依靠Baxter机器人和Kinect v2相机搭建实验平台,进行模型可行性的验证。利用空间四个点完成机器人的手眼标定,标定误差在可接受范围;利用top1矩形框内的三维点云,制定相对应的规则映射到实际的抓取参数;平台搭建完成之后,将四个不同的物体随机地放置在桌面上进行机器人的抓取和分类,实验证明本文的抓取及分类模型是可行且稳定的。
其他文献
【正】 1848年初,当整个环太平洋地区还处于前资本主义的不同发展阶段时,在太平洋彼岸的加利福尼亚发现了金矿,并由此而引起了震动世界的"淘金狂".这一发现以及随之而来的"淘
根据对深部岩体的地应力特征分析和对洞室围岩受力变形特点的分析,提出深部开挖洞室围岩分层断裂破坏机制:由于深部开挖工程中岩体地应力数值较大,且最大地应力方向可能与洞室轴
众所周知,财政、信贷、税收、价格是调控经济的四大杠杆.如何利用、发挥好价格这一经济杠杆的作用,推动和加快经济建设步伐,是值得我们研究的一道课题.笔者认为,价格杠杆的作
“话语”可解析为“言说(语)”与“语言”,相应地,“言说方式”与“语言模式”两个向度就成为分析人类话语范式演进的基本框架。在世界范围内,哲学话语的范式演进经历了古代本体论
详细介绍研制的低渗透介质温度-应力-渗流耦合三轴仪,该试验系统可以在常温~90℃范围、三轴室活塞最大轴向力1000kN、围压40MPa内对直径50和100mm的标准试样进行轴向和径向渗透
今天,每一个联想ERP项目组的成员都会说这样一句话,思想比IT技术本身重要的多。联想助理总裁乔健曾经对记者说,在这一点上,人的意识,人的素质的升华就显得尤为重要。全员培训
目的 数据挖掘法分析、总结中医药物治疗慢性阻塞性肺疾病的用药规律,并对中药用药规律相关中医机制进行探讨分析。方法 根据慢性阻塞性肺疾病的诊断要点或疾病特征,筛选《中
大学生在英语口语交际过程中普遍存在着语用失误。本文通过定量分析大学生的语用——语言失误和社交——语用失误,进一步探寻解决大学生语用失误的对策。