论文部分内容阅读
自然界中哺乳动物具有较强的环境认知能力和适应能力,可以依靠大脑内在的空间定位系统实现自主定位与导航。因此,模仿动物导航机理研究类脑仿生导航方法,为移动机器人的精确定位与快速导航提供了一种全新技术途径。当前仿生导航方法重点关注对大脑功能的理解,并提出生物学模型测试合理性,多数存在经验知识学习与仿生行为规划能力不足等问题,未能较好应用于真实环境下的移动机器人导航任务。本文借鉴哺乳动物大脑网格细胞、位置细胞等定位细胞空间认知机理,对移动机器人广义环境建模、认知地图构建及导航行为规划等关键问题开展研究,形成一种面向移动机器人的类脑仿生导航方法。主要研究内容如下:受情景记忆生物学基础及定位细胞认知机理启发,抽象状态神经元映射高维场景感知并模拟情景记忆组织过程,建立一种集成神经元学习和记忆形成动态过程的情景记忆模型。封装场景感知、状态神经元、位姿感知和相位感知表征移动机器人经验知识,创建连续递增的事件序列以存储机器人学习到的经验知识,实现对环境的广义建模,有效克服环境感知模糊问题。建模网格细胞-位置细胞神经元活动机制,实现网格细胞群放电模式与移动机器人运动位置的靶向关系,提出采用振荡相位编码机器人空间位置,为机器人事件提供精确位姿感知信息。面向移动机器人,提出一种基于情景记忆的自组织学习(Episodic Memory based Self-Organization Learning,EM-SOL)框架,为实现普遍环境下移动机器人的认知地图构建及导航行为规划提供技术支撑。为了提高认知地图对物理环境变化的适应能力,研究基于情景记忆网络增量学习的认知地图构建方法。借鉴神经元突触可塑性和集合序列特性,建立一种机器人自组织学习模型,提出状态神经元激活衰减机制以构建情景记忆网络,实现对移动机器人经验知识的增量学习,可以在不覆盖原有记忆的情况下对新环境进行学习。抽象情景记忆网络表达认知地图,通过自组织学习构建增量式认知地图,形成对移动机器人经验在拓扑空间和几何空间的综合表述,实现认知地图适应物理环境变化的积累、整合和更新。针对移动机器人长时运动过程中产生的累积偏差,提出一种相位重置机制用于校正移动机器人空间位置,从而保证认知地图的构建精度。该建图方法体现出较高的地图构建精度和效率,参数调节过程简单且适用范围广。针对普遍环境下的非特定目标导航任务,研究基于情景认知地图的移动机器人导航行为规划方法。首先,提出一种经验记忆启发的机器人全局导航路径规划策略,引入上下文状态神经元协同作用机制,解决状态神经元序列规划模糊问题,通过事件序列重组和优化,为移动机器人快速规划一条事件序列最短全局导航路径。其次,提出一种集成头朝向细胞和网格细胞的移动机器人分层认知导航行为规划方法,将目标导航任务离散成多个子目标导航任务,基于头朝向细胞网络活性及网格细胞放电模式相似度,协同引导移动机器人顺序经过每个子目标,有效提升到达目标点的置信度。最后,提出一种多传感器协同感知的局部导航行为推理策略,确保移动机器人能够实现障碍物避让并返回到规划路径,弥补了认知地图对环境不确定性表述的不足。作为有地图环境下移动机器人导航行为规划的拓展,进一步研究了基于深度强化学习的无地图导航行为规划方法。借鉴动物目标导向导航特性,引入启发式目标导向知识,提出一种启发式知识驱动的深度确定性策略梯度(Heuristic Knowledge based Deep Deterministic Policy Gradient,HK-DDPG)算法,用于指导移动机器人导航行为规划,可以有效减少机器人系统动作的随机性。针对原始DDPG算法样本数据利用率低、训练稳定性差等问题,引入时序差分误差,赋予经验回放池中不同样本数据的重要程度,提出一种基于权重的优化采样机制。结果表明HK-DDPG算法具有收敛速度快、学习效率高、稳定性好等特点,能够适应无地图环境下的自主导航,可以扩展到真实场景进行应用。该拓展研究为开发更加智能化的类脑仿生导航技术提供了有益探索。