面向智能服务机器人的多模态物体识别与定位技术

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:cuileidan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能服务机器人已经走进了普通民众的生活,并将在未来扮演越来越重要的角色。在工作过程中,机器人将会面临多种多样的物体定位和识别挑战,开发实用的视觉算法和技术是服务机器人研究领域的核心研究方向之一。本文针对智能服务机器人需要完成的典型任务,提出了一套基于深度卷积神经网络的物体分类器,和一套基于多三维摄像头的物体定位与识别系统。本文主要做出了如下创新:服务机器人需要从很少量的训练数据中训练识别分类器。传统的基于手工构建的特征的方法鲁棒性不强;而在小数据集上从头训练深度卷积神经网络会发生严重的过拟合现象。为将深度学习应用在服务机器人系统中,本文结合了迁移学习和数据增强的方法,并采用了学习率规划,成功使用少量数据训练了较大规模的神经网络分类器。该分类器具有一定的鲁棒性,可以在变化的环境中工作,并在机器人上实时运行。为获得待识别物体的图片,本文还利用了三维摄像头提供的点云信息对物体图像进行了有效的自动分割。实验中,分类器的精度超过了之前的分类器。三维摄像头可以提供比二维相机更丰富的视觉信息,其中很多对于服务机器人的物体操作过程十分有用,但是在小尺度下获得物体精确而完整的三维结构并不容易。本文使用了多个预先校准好变换关系的三维摄像头从不同角度对物体进行观测,获得了较为精确和完整的物体点云。从点云出发,实现了精度较高的物体定位和特征提取。随后搭建了实验平台对定位和识别结果进行了验证实验。通过系统分析实验结果,说明了本文的方法可以在一定程度上补偿三维摄像头的系统误差。实验中机械臂对各种物体进行了成功的操作,表明此方法的精度可以满足服务机器人的要求。
其他文献
随着信息科学技术的快速发展,人脸识别技术在信息安全领域承担着越来越重要的作用,应用于安全监控、电子商务、安全防务等领域的前景越发广阔。但实际应用中易受光照、遮挡、姿
现实问题中的数据通常是高维的,其中存在大量的不相关和冗余的特征,这给传统的学习算法带来了巨大的挑战。特征选择就是在这种情况下应运而生,是一种有效的降维方法。特征选
图像检索是当前互联网时代的基本需求。基于内容的图像检索(Content Based Image Retrieval,CBIR)是图像检索领域的热点研究方向。CBIR利用图像低层视觉特征进行图像的对比和
手势识别是人机交互领域的一个热点问题,而手势检测是手势识别的关键步骤之一。传统的手势检测不仅采用肤色检测而且还需要人手定位,计算复杂度高。深度传感器的出现为手势检
近年来,云计算这个概念越来越多地被人们讨论提及,各个国家也越来越重视发展云计算产业,包括微软,谷歌,亚马逊在内的世界著名的科技巨头公司,先后推出了云计算产品,同时很多
近年来机器嗅觉领域发展迅速,在工业生产、环境保护、安全检查、医疗诊断等领域中发挥着越来越重要的作用。气体识别系统作为机器嗅觉的一个典型应用,通常由交叉敏感的化学传
学位
图像是用来记录或者显示一些有用的信息的。然而,成像和拍摄过程中的缺陷使得最终的图像总是原来的场景的退化版本。消除这些缺陷,即图像恢复,对于后续的许多图像处理任务至
随着嵌入式技术的急速发展,嵌入式终端产品深入人心,其产生的安全问题也显得尤为重要。商人逐利,使得这些终端产品往往缺乏安全设计,使得其极易遭受攻击。为了有效地解决由嵌入式
当今互联网技术高速发展,尤其在教育工作领域中的应用更为广泛,这使得教育工作者能够更加快捷的进行教学与办公,极大地提高了日常工作效率。本文总结了目前现有教育网站和各