论文部分内容阅读
目前,人工智能为新时代科技革命提供了的强大的推动力,以机器学习为代表的传统人工智能已经应用到了许多研究领域,然而,机器学习往往面临着多种困境,如需要大量的训练数据等。为了突破这一瓶颈,大量的研究开始转向对大脑生理机制的探索与模仿,越来越多的研究人员认为类脑智能将是未来人工智能的发展方向,类脑智能也凭借着低功耗、弱监督等优势得到越来越多的重视和研究。机器人行为决策算法或行为控制策略是移动机器人学中的研究重点,本文将探索大脑中与行为决策相关的生理结构,并对其进行模拟,进而应用到移动机器人的行为决策和自主导航中。首先,本文在大量目标导向和决策相关的类脑仿生算法的基础上,结合小脑和基底神经节等神经调节系统的生理学机理,提出了一种基于小脑和基底神经节调节机理的类脑认知决策模型。该模型模拟了人脑中基底神经节和小脑的功能,并将二者相互连接形成一个能够实现移动机器人行为决策的混合模型。该混合模型利用调节发育网络来模拟小脑,从而加快基底神经节的学习收敛速度;同时,通过基于Actor-Critic的强化学习来模拟基底神经节,从而对小脑模型中的知识库进行更新和完善,使小脑可以在后续行为中获得更佳的决策能力。进一步地,将混合模型中基底神经节部分的动作选择策略改为基于ACC(前扣带回皮质)神经调节机制的动作选择策略。该方法是基于前扣带回皮质和前额叶皮层(PFC)对生物体阶段模式(phasic mode)和基音模式(tonic mode)的调节作用,通过对前扣带回皮层及相关神经组织结构的模拟和引入警觉度等相关参数,使智能体在收到负反馈时增强探索行为,而在收到正反馈时增强利用行为,从而实现智能体在探索环境和利用环境之间动态平衡,进一步改善混合模型的行为决策质量。最后,在模型构建完成后,将该混合模型应用于移动机器人的自主导航场景中,并通过多种实验方式来验证所提出混合模型在行为决策和自主导航等方面的有效性。首先,本文将所提出的混合模型应用到MATLAB平台上的机器人自主导航仿真实验;之后,将所提出的混合模型与多种广泛使用的算法模型进行机器人自主导航仿真实验对比;最后,将所提出的混合模型移植到基于ROS的移动机器人上,并分别在Gazebo物理仿真平台和真实场景中的Rikirobot平台上进行机器人自主导航实验。实验结果表明,本文所构建模型在机器人行为决策和自主导航中具有学习收敛速度更快、收敛后效果更好、适应性更高等优势。