论文部分内容阅读
深度学习为机器人应用领域提供了一个而强大的视觉感知工具。区别于传统图像方向的模式识别应用,基于深度学习的视觉感知算法抛弃人工特征工程,采用数据驱动的形式进行自适应特征学习,并具有强大的非线性函数拟合能力,在多种不同的任务中均取得较好的成绩。深度学习的数据驱动特征赋予算法高度的自适应能力和学习进化能力,适用于机器人应用中的非结构化环境。在基于视觉的移动导航应用上,传统视觉算法的任务为目标检测与定位和地图构建等。目标检测为导航算法提供关键物体或者关键点的相对位置,作为跟踪目标或者运动目的,同时辅助定位;地图构建则为全局环境感知,特别为避障地图的构建,为后续路径规划和运动决策的基础。基于深度学习的目标检测与跟踪算法可以克服传统算法的低层次感知缺点,适应和解决非结构化环境、遮挡以及目标复杂等问题。基于深度学习的语义分割对视野进行所有像素进行分类,可得到一副稠密的语义地图,可作为避障地图或者信息富集的地图使用,为复杂以及智能化的路径规划以及运动决策提供可能。深度学习模型本身参数量巨大,在工程实现和应用上主要有两个问题。首先,深度学习模型由于“深”,模型体积大,总体参数量巨大,计算时延高,对计算资源要求高;其次,深度学习的巨大参数量要求有同等量级的数据进行训练,以防止严重的过拟合现象。机器人应用领域的机器人机载计算资源相对较差,且数据采集困难以及成本高。针对参数量大以及时延高问题,需要对模型进行结构化优化,降低模型体积以及降低计算成本;针对数据来源困难问题,采用迁移学习的思路,借用开源数据进行模型预训练,在降低对自有数据量的要求的同时增强模型的泛化能力。本文主要探索深度学习在移动导航上的视觉算法研究与应用。在前三章基础理论分析与研究的基础上,进行多任务网络设计,实现一个神经网络同时满足多个任务需求。该多任务网络设计思路可增加卷积神经网络的复用率,降低模型体积以及计算时延。同时,探索基于深度学习的视觉到运动决策映射的端对端神经网络,实现“看一步走一步”视觉导航策略。针对上述设计模型的训练问题,采用迁移学习的思路。所有模型均进行了离线和在线实验,证明了深度学习在移动机器人视觉导航应用上的可行性。最后在总结与展望中进一步挖掘外来工作的可能性。