点面特征与YOLOv4-tiny的室内动态环境下SLAM研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:acy333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年随着人工智能技术的发展进步,智能化移动机器人开始逐渐的在我们的生活中崭露头角,视觉SLAM技术可以帮助机器人在陌生的环境中进行自我定位和构建周围环境的地图,在室内各种复杂多变的环境中完成作业任务。目前基于特征点匹配的视觉SLAM算法大多数都假设外部环境是静态的,但是在现实环境中不可避免的会出现一些移动物体,例如室内行走的行人和被搬动的桌子等,所以在现实环境中并不能满足静态环境这一基本假设,这些移动物体会导致视觉SLAM系统定位精度和建图准确性的降低。然而,目前大部分基于深度学习的动态视觉SLAM算法都存在实时性差的问题,当外部环境发生变化,由动态场景变成弱纹理场景时候,由于场景中缺乏纹理特征,造成特征点提取的困难,就会造成跟踪丢失的现象,因此本文以室内动态场景和弱纹理场景为研究对象,以提高视觉SLAM算法的稳定性和实时性为研究目标,改进了一种基于点面特征和深度学习的视觉SLAM算法,主要创新点如下:(1)轻量化动态视觉SLAM算法研究。为解决目前现有的动态视觉SLAM大部分都存在实时性差和定位精度低的问题,本文以ORBSLAM2为研究基础使用精细化的轻量级目标检测模型YOLOv4-tiny对前端采集到的RGB图像进行目标检测,同时结合对积几何和LK光流法处理场景中不存在先验知识的移动物体,对提取到的动态特征进行剔除,使用静态特征点对相机进行位姿估计。由于轻量化目标检测模型存在检测精度低的问题,在文中通过引入混合注意力机制模块,使得模型能够保证检测速度的同时,提高目标检测的精度。使用TUM公共数据集进行了室内动态环境中的定位建图实验,通过大量的实验数据证明,和ORBSLAM2系统相比,本文所改进的算法在行人来回走动的室内高动态环境中位姿估计的精度可以提高93.35%,处理每一帧分辨率为680×480大小的图片耗时21.49ms,在保证实时性的前提下,又能达到较高的定位精度,能够有效的处理算法运行时的准确度和速度的均衡。(2)点面特征优化的鲁棒视觉SLAM研究。当外部环境由动态环境变化为特征信息不丰富的弱纹理场景时,由于特征点的缺乏可能会发生跟踪丢失的现象,进而导致算法的稳定性降低。为进一步提高视觉SLAM系统处理外界环境变化的能力,本文在ORB-SLAM3的研究基础上,在前端提取特征点的同时,结合深度点云信息对场景中的平面特征进行提取,结合场景中的点和平面特征并基于相机的匀速运动模型来对相机的位姿进行追踪,以此来解决场景中由于特征点不足导致的跟踪丢失的问题;在公共数据集TUM上和真实的宿舍楼室内环境中都进行了定位建图实验,实验结果表明,和ORB-SLAM3相比,本文所改进的算法位姿估计的精度可提高94.08%,当外界环境由动态场景变化为弱纹理场景时,结合相机的运动轨迹可以看出,本文所改进的算法可以长时间稳定的运行在弱纹理场景中,不会发生跟踪丢失的现象,真实场景中的实验结果同样也证明了本文所改进算法的有效性和鲁棒性。
其他文献
《中国制造2025》重点领域技术路线中明确提出要实现航空发动机、发电设备等高端装备的实时故障诊断,提高我国工业信息化水平。流体机械装备在航空航天、发电机组、军工领域均有着大量应用,掌握流体机械装备的故障特征,对确保航空航天、发电机机组等领域的安全生产和可靠运行具有重要意义。随着智能制造的发展,传统故障诊断方法在实际应用与发展中具有很大局限,深度学习有着强大的自主学习和模式识别的能力,在工业设备的故
学位
软件结构设计不佳的症状可通过正确的重构步骤解决。多数代码异味检测工具仅输出检测结果,忽略了结合开发者的需求对检测出的异味按照其强度进行排序,从而将判断异味重构优先级的耗时过程留给了开发人员。部分异味排序模型仅关注代码度量等结构特征,而代码间的层次结构及关联关系等语义信息在较多软件工程研究中被证明有效,却在代码异味排序领域少被研究。本文根据类级代码异味特征以及图结构可对对象及其相关关系建模的特性,考
学位
在计算机技术广泛运用和人工智能快速发展的新时代下,越来越多的人开始学习编程。面对大量编程学习者,教育者如何实时跟踪学习者的知识掌握情况,成为亟待解决的关键问题。知识追踪是解决此类问题的有效手段之一,已经成为人工智能+教育领域的研究热点。但现有知识追踪方法普遍存在习题表示缺乏结构化、信息单薄,以及学习者答题预测准确度偏低的问题。本文以编程知识图谱和学习者答题过程为核心,优化习题表示方式和学习者知识状
学位
随着在线自适应学习的快速发展,教学方式逐步走向线上线下融合的模式,大量教学资源实现了平台共享,通过此类方式在线教育学习平台产生了大量的准实时的在线学习记录,从而为知识状态诊断、自适应学习计划制定、动态学习策略生成、学习进度追溯提供了实现基础。知识追踪(Knowledge Tracing,KT)已经发展成为在线教育系统的重要组成部分,作为在线教育系统的一个关键组成部分,知识追踪通过追踪每个学习者的学
学位
随着社会经济的快速发展,各行业对机器视觉的依赖在逐年提升。因其能够提供直观、有效的分析方法,助力实现车辆的自动或辅助驾驶,机器视觉在智能交通系统和智能网联汽车领域获得了极其广泛的应用。在智能网联汽车的研究中,精确的车道识别可以辅助机动车及骑车者的自动跟踪;与机动车道不同,非机动车道往往在车道宽度、标记方式等诸多方面存在较大的差异。为此,本文专门针对多场景自行车道检测问题的复杂性和多态性进行研究,为
学位
代码异味是指任何可能导致代码深层次问题的症状,其通常是由开发人员在程序中的设计缺陷或不良编码习惯而引起。传统代码异味识别方法因缺乏规范的判断标准而带有较强的主观性,并受开发者、开发语言、开发方法等多种因素影响。代码异味强度是异味严重性程度的表征,划分异味的不同强度有助于开发者对不同异味处理进行优先级排序,从而使高危险性代码问题得到优先处理,以减少软件项目的开发与维护成本。目前有关异味强度的研究资料
学位
软件缺陷是软件可靠性降低的重要原因,研究人员通过建立软件缺陷预测模型预测缺陷,进而通过合理分配用于保障软件质量的资源。随着机器学习理论的不断创新,许多研究者利用机器学习算法建立软件缺陷预测模型,然而目前关于软件缺陷预测相关的研究并不能取得理想的效果。主要存在以下四个问题:(1)用于训练和预测的数据集往往存在数据规格不统一和特征冗余问题,增加了模型的复杂度和过拟合风险。(2)对模型的基本分类器研究不
学位
电磁逆散射是根据测量得到的散射数据来重构未知目标的物理参数分布,获得目标的位置、轮廓、结构等信息,具有无接触探测的特点,广泛应用于车站机场安检、雷达目标识别、穿墙成像、医学成像、卫星遥感、地球物理探测等领域。电磁逆散射问题的控制方程具有非线性和不适定性的特征,传统求解方法包括线性近似算法和迭代优化算法,这两种算法都属于非学习类求解方法,其中线性近似算法求解速度较快,但是重构精度不高;迭代优化算法的
学位
语义分割是对图片进行像素级别的分类,进而实现对图片像素级别的理解。传统的语义分割需要利用大量的标注数据来训练网络,才能达到较好的性能。但这些数据的标注会极大地消耗人力物力。另外,传统语义分割的泛化能力不足,无法实现图片分割的真正智能化。因此,近年来基于少量训练数据的小样本语义分割成为研究的热点。小样本语义分割是利用少量的支持集数据对查询集图片中的目标物体进行分割。目前常用的一大类方法是基于原型网络
学位
颗粒作为一种常见的分析测量对象,在工业、医学和农业等领域应用广泛。目前,基于图像的颗粒分析算法能够方便快捷地统计颗粒数目并分析颗粒参数,成为国内外众多学者在图像领域的研究重点。但颗粒图像普遍存在光照强度不均,对比度低,相互粘连等情况,现有的分割方法容易产生欠分割和过分割现象。为解决上述问题,本文提出了一种基于二次超像素分割与改进Logit Boost的颗粒图像分割算法(TS-EL),有效地提高了颗
学位