论文部分内容阅读
机器人导航是机器人领域中一项重要的技术,广泛应用于自动驾驶、国防航天、物流配送、巡逻安检等各个领域当中。近年来人工智能技术的发展,尤其是深度学习和计算机视觉等技术的发展为该领域的研究发展带来了新的契机,众多工业和学术界的研究人员针对该领域开展了丰富的研究。
虽然目前该领域已经有了诸多经典的工作,但是一方面系统设计的复杂性,对数据样本的需求以及模型的可解释性一直是不同技术框架中难以平衡的问题。另一方面大多数工作中单视觉传感器的设置限制了机器人的感知范围,这为导航任务带来了安全隐患。在本文中,我们提出使用多个相机传感器来进行场景感知,但是简单的多相机特征融合会存在信息因果混淆从而导致模型过于依赖某一视角信息的问题。基于此我们提出将不同相机来源的视觉信息作为单独的通道进行处理,并提出了一种多任务视觉感知网络,该网络分别接收不同相机的图像数据并用来预测导航相关任务。为了实现机器人室外全局导航功能,我们利用第三方地图API根据起始点和目标点得到带有规划路径信息的2D地图并利用GPS信息来定位车辆所在位置,根据该地图我们利用神经网络来预测机器人下一个路口的前进方向。我们的整体算法综合了多种技术框架,一方面我们利用了端到端模仿学习的思路来降低了系统设计的复杂性,另一方面根据上述神经网络的输出结果我们提出了一系列导航指标来作为环境的低维表示,我们利用基于规则的方法根据这些导航指标来设计机器人的控制器,从而为机器人提供更具有可解释性的,安全的控制命令。
本文对上述提出的神经网络在验证集上进行了实验分析并将算法运用到了真实的机器人平台上。我们在现实场景中测试该算法的导航性能,并将将我们的算法性能与一些经典算法进行了比较。最终证明无论是在局部避障还是全局导航方面,我们的算法都具有较好的性能。
虽然目前该领域已经有了诸多经典的工作,但是一方面系统设计的复杂性,对数据样本的需求以及模型的可解释性一直是不同技术框架中难以平衡的问题。另一方面大多数工作中单视觉传感器的设置限制了机器人的感知范围,这为导航任务带来了安全隐患。在本文中,我们提出使用多个相机传感器来进行场景感知,但是简单的多相机特征融合会存在信息因果混淆从而导致模型过于依赖某一视角信息的问题。基于此我们提出将不同相机来源的视觉信息作为单独的通道进行处理,并提出了一种多任务视觉感知网络,该网络分别接收不同相机的图像数据并用来预测导航相关任务。为了实现机器人室外全局导航功能,我们利用第三方地图API根据起始点和目标点得到带有规划路径信息的2D地图并利用GPS信息来定位车辆所在位置,根据该地图我们利用神经网络来预测机器人下一个路口的前进方向。我们的整体算法综合了多种技术框架,一方面我们利用了端到端模仿学习的思路来降低了系统设计的复杂性,另一方面根据上述神经网络的输出结果我们提出了一系列导航指标来作为环境的低维表示,我们利用基于规则的方法根据这些导航指标来设计机器人的控制器,从而为机器人提供更具有可解释性的,安全的控制命令。
本文对上述提出的神经网络在验证集上进行了实验分析并将算法运用到了真实的机器人平台上。我们在现实场景中测试该算法的导航性能,并将将我们的算法性能与一些经典算法进行了比较。最终证明无论是在局部避障还是全局导航方面,我们的算法都具有较好的性能。