深度学习下视觉地点识别研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：zhang19890922

【摘要】

：

机器人技术经过长期的发展,现已成为社会中不可缺少的组成部分。目前机器人已成为提高生产效率和降低人力成本的重要工具。随着社会老龄化问题的加重及劳动力成本的飙升,机器

【作者】

：

白栋栋

【出处】

：

国防科技大学

【发表日期】

：

2019年01期

【关键词】

：

机器人视觉地点识别卷积神经网络序列图像匹配图像检索范围基于卷积神经网络的地点识别框架

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器人技术经过长期的发展,现已成为社会中不可缺少的组成部分。目前机器人已成为提高生产效率和降低人力成本的重要工具。随着社会老龄化问题的加重及劳动力成本的飙升,机器人越来越受到国内外学术界和产业界的重视。伴随着我国2025计划的提出和国家对于人工智能技术的关注,机器人领域开始蓬勃发展,各类机器人如雨后春笋般进入人们的生活。做为机器人领域的一项关键技术,视觉地点识别(Visual Place Recognition)也受到了越来越多的科研人员的关注。视觉地点识别主要是解决“我在哪儿?”这样一个问题。它是解决计算机视觉和机器人领域许多问题(如基于语义的图像检索、同时定位与地图构建中的回环检测模块、视觉定位以及增强现实等)的关键组件。目前视觉地点识别主要面临三大挑战:(1)算法对于条件变化的鲁棒性要求;(2)算法对于视角变化的鲁棒性要求;(3)算法运行的效率要求。其中,条件变化是指由于昼夜、天气和季节等外界条件的变化导致相机在同一地点拍摄的图像呈现出不同的外观;视角变化是指由于相机的朝向不同导致在同一地点拍摄的图像呈现不同的外观;效率要求则是指若机器人在较大场景(比如城市级别)中运行时,视觉地点识别算法应在可接受的时间范围内给出响应。本文针对视觉地点识别面临的鲁棒性问题和效率问题,深入开展了基于深度学习的视觉地点识别的算法研究,主要研究内容及创新点如下:1.面向视觉地点识别的图像表示随机误差分析及应用(第二章)视觉地点识别通常被建模为实例检索任务,即将当前观测的图像与带有地理位置标签的图像数据库中的图像进行匹配,并由此进行地点的识别和定位。因此,图像表示随机误差的大小是影响地点识别算法精度的关键因素。本文首次对图像表示的随机误差进行了分析,确定了影响随机误差的主要因素,并在此基础上提出了一种能够降低图像表示随机误差影响的视觉地点识别算法SeqCNNSLAM。实验结果显示,相比于其他的视觉地点识别算法,SeqCNNSLAM能大幅度提高地点识别算法的精度。另外,为了进一步提升图像表示向量对于环境的表示能力,特别是对于地标建筑等有价值信息的表示能力,我们基于SeqCNNSLAM提出了基于图像块的SeqCNNSLAM(简称P-SeqCNNSLAM)。实验结果表明,相比于SeqCNNSLAM,P-SeqCNNSLAM能进一步的提升视觉地点识别算法的精度。2.基于物理空间和图像表示空间拓扑关系的检索范围约束方法(第三章)随着机器人的运行,其采集的图像会越来越多。当机器人做地点识别时,如果不能恰当约束数据库中查询图像的候选匹配图像的范围,候选匹配图像的数量将会越来越大,这将导致系统识别一张图像对应的地点所需的计算量会越来越大,以至于算法的响应时间难以满足效率要求。针对以上问题,本文研究了机器人采集的图像在物理空间和图像表示空间中的拓扑关系,并以此提出了一种能约束图像检索范围的视觉地点识别算法A-SeqCNNSLAM。实验表明,在标准的数据集上,相比于SeqCNNSLAM算法,A-SeqCNNSLAM可以在取得相当的精度的同时,实现20倍左右的时间加速。3.面向视觉地点识别的端到端的图像特征提取–聚合–压缩方法(第四章)研究证明,相比于传统人工特征,视觉卷积特征具有更高的鲁棒性和泛化性能。虽然已有科研人员提出了一些面向视觉地点识别的神经网络,但是现有的方法都未能同时满足算法的精度和效率的需求,即图像表示的高区分度是以高维度为代价的,这势必大幅度增加图像匹配的计算量,给实际使用带来较大的不便。本文依照经典的实例检索流程提出了一种基于卷积神经网络端到端训练的视觉地点识别框架NetPR。该框架包含特征提取、特征聚合、表示压缩三个模块,它兼顾了算法的精度和效率要求,可以直接生成低维度高区分度的图像表示。为了验证NetPR的有效性,本文基于NetPR框架构建了两个神经网络:NetPR1.0以及NetPR2.0。实验结果表明,相比于现有的视觉地点识别算法,基于NetPR框架的算法能在大幅度降低图像表示维度的同时提升算法的精度,即是实现了高效且鲁棒的视觉地点识别算法。4.视觉地点识别系统设计实现方案(第五章)本部分以现有的研究成果和本文的创新点为基础,以视觉地点识别的几个常见应用场景为切入点,提出了一套完备的系统设计实现方案,以指导实际系统的构建和算法的产品化。

其他文献

基于模态切换技术的MEMS轴对称谐振陀螺测控系统研究

近年来,MEMS轴对称陀螺由于在航空航天、医疗、汽车电子以及智能AI等领域广阔的应用价值和前景逐渐成为MEMS传感器领域的研究热点。而环式陀螺(DRG)作为轴对称陀螺的典型结构

学位

MEMS轴对称谐振陀螺模态切换偏置稳定性

从即兴开始

学位

价值视阈下智能劳动探析

随着技术的不断发展,人工智能对我们的影响越来越大。正确认识人工智能的活动已经成为我们绕不开的一个话题。比较代表性的观点有三:其一,传统的观点认为人工智能的活动不过

学位

智能劳动人工智能价值理论

大地艺术与工程建设的共处关系

通过对工程建设的空间生产与地理场的场源认识,提出研究对象的三个基本要素:工程建设与大地艺术在地理空间层面与社会背景层面的认识;关于艺术与社会的内在辩证关系;工程建设与大地艺术在共处关系中如何再认识自身。从大地艺术与工程建设的共处关系这一角度出发,分析与探讨大地艺术中的“地”的基础性产生与在空间综合体里的意义。并借助工程建设作为参照,阐述大地艺术与工程建设在社会公共困境里的现实问题与“脱域”性结构。

学位

基于改进DDPG算法的双足机器人行走稳定性研究

双足机器人是腿足机器人领域的研究热点和重要的研究方向,相对于轮式、履带式其他类型的移动方式的机器人而言,具有更高灵活性和环境适应性,且更贴近人类的特征,具有重要的研

学位

双足机器人步态规划DDPG算法RBF神经网络SumTree样本池

岸花沾露满，湖月漾波宽

避暑山庄是清代盛期园林建筑的代表性作品,也是古代建筑艺术的高峰。临芳墅是避暑山庄内部的园中园之一,是湖区西北一侧山区与湖区交界处的重要建筑,其特点可概括为“功能性大于园林性”的特点,不仅有门殿知鱼矶提供的良好景域视野,还有休憩的主殿临芳墅和贮藏之用的库房,以及清代御舟青雀舫停靠的西船坞,是一处综合功能和综合性审美的特殊园林,前人的研究尚处于空白阶段,对临芳墅的复原与研究是完善避暑山庄基础理论的重要

学位

发现佛光寺

本文以1937年,梁思成等中国营造学社成员发现佛光寺东大殿为唐代建筑,这一历史事件为选题,主要讨论“何为发现”以及“为何发现”这两个问题,重点在于对事件本身以及事件所处时代背景的研究。事实上,在梁思成之前,佛光寺作为佛教寺庙一直持续有建筑营造与宗教活动,并保留有比较完善的文字史料与实物例证。因此将梁思成的发现置于佛光寺沿革这个大脉络中看,这是一个新视野的发现、一个新身份的发现——它将佛光寺以唐代建

学位

微电网能量优化调度研究

微电网将可再生能源、冷热电联供系统和储能单元等集中在一起,组成微网系统,具有很好的技术、经济和环境效益。但是微电网内分布式电源种类多,风光发电、负荷需求具有很大的

学位

微电网能量优化不确定性经济调度冷热电联供系统粒子群算法

基于二元决策图的无线传感器网络可靠性与竞争失效问题分析

无线传感器网络(WSN)如今在军事、医疗、工业等多种领域中被广泛应用。可靠性作为WSN的一个重要性能指标,是保障传感器网络能够正常工作,发挥其功能的重要因素。特别是随着信

学位

二元决策图算法故障树分析可靠性分析竞争失效分布函数

HT公司LA环境综合治理项目成本估算、预算与控制研究

随着我国城市化建设的不断快速推进,城市的环境保护、环境优化等已经成为建设新型城市的重点考虑内容。其中,对于城市环境保护、污水治理不但关系人民幸福生活,同时也是抑制

学位

成本估算成本预算成本控制

深度学习下视觉地点识别研究

其他学术论文