基于图像理解的室内服务机器人障碍物检测

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:godwin82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在室内服务机器人的应用中,其障碍物检测是完成室内服务工作的非常重要的一环。由于室内服务机器人对于视野中目标识别的视角跟我们人为的视角有所不同,本文从室内服务机器人的视角出发,对其视野中的障碍物进行新的理解,自行建立数据集进行障碍物检测。具体研究内容如下:常见的室内定位技术主要包括超声波、蓝牙、WiFi和视觉定位,其中基于图像的室内定位技术精度比较高。综合不同相机的精度、稳定性和对电脑计算内存的消耗考虑,本文选用深度相机进行室内障碍物检测的图像采集。本文在公开数据集VOC 2007上选择10类目标,对Faster R-CNN、YOLO算法和SSD算法这三种算法进行了准确率和实时性的测试。测试结果表明,Faster-R-CNN识别率最高,但是其处理速度很慢,YOLO和SSD的实时性相近,SSD的整体检测效果要好一些。所以本文选择使用SSD算法来实现障碍物检测,并对该算法进行针对性的改进。为了提高本文深度学习算法的目标识别的实时性,本文将SSD算法与Mobilenet相结合,构建了一种新的多尺度卷积神经网络。并从机器人的视角出发自行建立数据集,分为10类:bucket、flower rack、garbage basket、sofa、table leg、box、chair、computer、fire extinguisher、refrigerator。对原算法和改进的算法在公开数据集VOC 2007和自建数据集上分别进行了对比,结果显示改进算法虽然在目标识别准确率上有略微降低,但是其处理速度有了很大程度的提高,证明了本文改进算法的可靠性。本文使用Kinect深度相机实现了障碍物的深度信息的测量。通过深度学习对障碍物进行识别得到图像分割区域,找到该区域的正中点,将该正中点的深度信息设定为障碍物目标的深度信息,并做了深度信息测量实验,实验结果达到最初设定要求。最后,本文设计了基于后端机器人障碍物检测机器人,机器人前端采集图像信息,后端PC机完成核心算法的执行和上位机显示。用自建数据集中的10类障碍物进行深度信息的精度测量,测量结果显示距离越近,障碍物深度信息识别精度越高,并且在设定距离为60厘米的情况下,平均距离精度可达到0.932,满足室内服务机器人对避障的精度需求。通过本文各项试验和分析,可以证明本文改进深度学习算法的有效性和整体室内服务机器人障碍物检测的稳定性和可靠性。
其他文献
随着通信技术的发展,生活中基于位置的服务应用越来越广泛,使得室内定位技术的研究越来越受到重视。由于室内的环境相对复杂,干扰众多,如何提高室内定位精度是目前室内定位领
感应加热技术是利用法拉第电磁感应定律,在时变的磁场中产生涡流,从而给工件进行加热,目前广泛应用在冶金、机械加工、国防等工业领域中,相比于传统的直接加热技术,具有加热
目的:本研究收集我院60例胃肠道恶性肿瘤手术患者,探讨应用胸腺五肽对患者围手术期免疫功能的影响,并分析患者免疫功能的变化对其术后近期疗效(术后感染发生率、吻合口瘘的发生率和胃肠功能恢复时间、术后住院时间)的影响,并评估临床应用价值。方法:我们从2017年6月至2018年10月于我院行腹腔镜下胃肠道恶性肿瘤根治术的患者60例,数字随机表法随机分为两组,观察组30例(常规治疗+胸腺五肽肌肉注射10mg
异质人脸图像的转换指将人脸图像从一类视觉域,经过合成算法转换到另一类视觉域。随着计算机视觉和深度学习算法的不断发展,异质人脸图像转换在公安安防系统、智能美妆、社交
近年来,服饰图像的研究随着计算机视觉技术在视觉时尚领域的快速发展而引起越来越多人的关注。当前,在服饰时尚领域主要围绕服饰图像识别、关键点检测、服饰推荐、检索和搭配
红外探测器是将红外辐射能量转换成便于计量的物理量的器件,广泛应用于军事、气象、农业、工业、医疗等领域。半导体红外光电探测器有多种结构。其中,量子阱探测器具有良好的均匀性与较高的可靠性,适合于大规模焦平面阵列的制作。同时,它们适用于制作双色和多色探测器。然而,量子阱红外探测器的工作原理决定了探测器的性能难以提升。多数研究人员致力于提高器件光耦合的效率。但也有研究人员提出了改进器件内部结构的方法。其中
图像文本识别作为环境感知型的一种计算机视觉任务,广泛用于自动化纸质文档识别、自动驾驶和场景语义理解等任务中。近些年,基于深度学习的文本识别方法逐渐成为研究人员关注
"CG"为Computer Graphics的英文缩写,是通过计算机软件所绘制的一切图形的总称,随着以计算机为主要工具进行视觉设计和生产的一系列相关产业的形成,国际上习惯将利用计算机技
随着大数据、云计算等计算机网络技术迅猛发展,网络流量产生的数据呈现出爆炸式增长的趋势,传统网络正面临着底层资源管理不当、可扩展性差等方面的挑战。近年来出现的软件定
图像描述任务是自然语言处理和计算机视觉领域的交叉课题,近些年引起了国内外学者的广泛关注。随着人工智能技术的兴起,很多有效的图像描述模型被提出,但是大多数模型都将长