论文部分内容阅读
生物的运动平衡控制技能源自于感觉运动神经系统的学习,而内在动机系统发挥了重要作用。探索感觉运动神经系统中的内在动机机理,将内在动机理论形式化,模拟和复制这种自组织控制机制的结构和功能,并应用于机器人系统,通过机器人的学习和训练,渐进获得类似人和动物的自主学习能力和运动平衡控制技能,是当前机器入学、认知科学、心理学、神经生理学及控制科学领域研究的主要课题。本文结合认知科学、心理学以及神经生理学,从仿生的角度建立了不同网络结构的内在动机模型,探索了感觉运动神经系统的自主学习和控制机制,以两轮自平衡机器人为实验平台,研究了基于内在动机的仿生学习模型在机器人运动平衡控制过程中的自主发育和学习能力。论文取得的主要研究成果如下1)基于操作条件反射的内在动机模型本文提出了一种基于操作条件反射原理的内在动机仿生模型(OC-IM),该模型在操作条件反射的理论框架下,把生物感觉运动神经系统中自主发育和学习的内在驱动能力,以神经计算的数学模型形式体现出来,并应用在两轮机器人上,使机器人经过自主发育和学习,概率式地选择最优行为,从而保持两轮机器人的运动平衡状态。仿真结果表明,该内在动机仿生学习模型能够使两轮机器人通过自主学习和训练,成功获得自主平衡控制技能,表现出了良好的自主控制运动平衡的学习能力。2)记忆可增长型内在动机仿生模型本文提出一种记忆可增长型内在动机仿生模型(GCS-IM),该模型可以根据经验的积累和任务的需要,向网络的竞争层插入新的神经元,增加网络细胞个数,自主而动态地调整网络大小和结构。根据生物在认知发育过程中概率式选择动作的生理行为,进而采用Boltzmann机进行概率式优化动作选择方式,突出内在动机随机选择行为的自主过程,并将其应用于机器人的运动自平衡控制中,仿真实验说明该算法能达到预期的控制目标,学习速度和动态性能上都表现出了更好的控制性能,体现出类似人和动物内在动机的认知发育过程。3)记忆可删减型内在动机仿生模型由于不同任务的复杂程度不同,神经网络的结构很难确定,有时会过于复杂,导致较低的计算效率和泛化能力,易出现过拟合现象。本文设计了一种记忆可删减型内在动机模型(OBS-IM),包含评价神经网络和行动神经网络。该模型针对神经网络规模过大问题,通过改变Hessian矩阵的方法对网络的误差函数进行调整,可同时删除多个神经元权值,调整剩余神经元权值,获得较快的网络结构调整速度。将该模型应用在两轮机器人的运动平衡控制中,仿真实验结果表明,记忆可删减型内在动机模型(OBS-IM)有较快的学习速率和良好的动态性能,同时也体现了类似生物内在动机的认知和学习过程。4)基于内在动机的发育机器人感觉运动系统鉴于感觉运动系统的复杂性,本文在可增减型动态结构神经网络的框架下,提出了一种基于内在动机的感觉运动系统,并根据网络隐层神经节点敏感度值的大小,确定增加或删减神经元个数,改善网络学习速率、提高网络处理复杂问题的能力。该认知模型主要由三大模块组成:动作控制模块、预测模块以及缓冲模块。其中,动作控制模块可实现状态到行为的映射,预测模块是对动作实施概率式选择,而缓冲模块则是接收并发送有用信号给动作控制模块与预测模块,从而使感觉运动系统的生理功能得以实现。并将基于内在动机的感觉运动系统应用于两轮机器人运动平衡控制中,仿真实验结果表明,该认知模型可通过不断地自主学习和发育,完善其运动平衡控制技能,验证了该模型拥有较强的认知和发育能力。