发育机器人内在动机系统的研究

来源 :北京科技大学 | 被引量 : 1次 | 上传用户:bluecluse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物的运动平衡控制技能源自于感觉运动神经系统的学习,而内在动机系统发挥了重要作用。探索感觉运动神经系统中的内在动机机理,将内在动机理论形式化,模拟和复制这种自组织控制机制的结构和功能,并应用于机器人系统,通过机器人的学习和训练,渐进获得类似人和动物的自主学习能力和运动平衡控制技能,是当前机器入学、认知科学、心理学、神经生理学及控制科学领域研究的主要课题。本文结合认知科学、心理学以及神经生理学,从仿生的角度建立了不同网络结构的内在动机模型,探索了感觉运动神经系统的自主学习和控制机制,以两轮自平衡机器人为实验平台,研究了基于内在动机的仿生学习模型在机器人运动平衡控制过程中的自主发育和学习能力。论文取得的主要研究成果如下1)基于操作条件反射的内在动机模型本文提出了一种基于操作条件反射原理的内在动机仿生模型(OC-IM),该模型在操作条件反射的理论框架下,把生物感觉运动神经系统中自主发育和学习的内在驱动能力,以神经计算的数学模型形式体现出来,并应用在两轮机器人上,使机器人经过自主发育和学习,概率式地选择最优行为,从而保持两轮机器人的运动平衡状态。仿真结果表明,该内在动机仿生学习模型能够使两轮机器人通过自主学习和训练,成功获得自主平衡控制技能,表现出了良好的自主控制运动平衡的学习能力。2)记忆可增长型内在动机仿生模型本文提出一种记忆可增长型内在动机仿生模型(GCS-IM),该模型可以根据经验的积累和任务的需要,向网络的竞争层插入新的神经元,增加网络细胞个数,自主而动态地调整网络大小和结构。根据生物在认知发育过程中概率式选择动作的生理行为,进而采用Boltzmann机进行概率式优化动作选择方式,突出内在动机随机选择行为的自主过程,并将其应用于机器人的运动自平衡控制中,仿真实验说明该算法能达到预期的控制目标,学习速度和动态性能上都表现出了更好的控制性能,体现出类似人和动物内在动机的认知发育过程。3)记忆可删减型内在动机仿生模型由于不同任务的复杂程度不同,神经网络的结构很难确定,有时会过于复杂,导致较低的计算效率和泛化能力,易出现过拟合现象。本文设计了一种记忆可删减型内在动机模型(OBS-IM),包含评价神经网络和行动神经网络。该模型针对神经网络规模过大问题,通过改变Hessian矩阵的方法对网络的误差函数进行调整,可同时删除多个神经元权值,调整剩余神经元权值,获得较快的网络结构调整速度。将该模型应用在两轮机器人的运动平衡控制中,仿真实验结果表明,记忆可删减型内在动机模型(OBS-IM)有较快的学习速率和良好的动态性能,同时也体现了类似生物内在动机的认知和学习过程。4)基于内在动机的发育机器人感觉运动系统鉴于感觉运动系统的复杂性,本文在可增减型动态结构神经网络的框架下,提出了一种基于内在动机的感觉运动系统,并根据网络隐层神经节点敏感度值的大小,确定增加或删减神经元个数,改善网络学习速率、提高网络处理复杂问题的能力。该认知模型主要由三大模块组成:动作控制模块、预测模块以及缓冲模块。其中,动作控制模块可实现状态到行为的映射,预测模块是对动作实施概率式选择,而缓冲模块则是接收并发送有用信号给动作控制模块与预测模块,从而使感觉运动系统的生理功能得以实现。并将基于内在动机的感觉运动系统应用于两轮机器人运动平衡控制中,仿真实验结果表明,该认知模型可通过不断地自主学习和发育,完善其运动平衡控制技能,验证了该模型拥有较强的认知和发育能力。
其他文献
近年来,在我国经济飞速发展的同时,企业社会责任问题频发,引发了越来越多的公众关注,企业社会责任逐渐成为衡量企业综合实力的核心指标之一。本文以全国私营企业调研数据为样
张爱玲小说中的女性生存在悲剧性的苍凉之中,几乎所有的人都面临着生存与婚姻的困窘与危机,都在迷茫中追逐婚姻以求安全,同时又不得不生活在猥琐、难堪和失面子的屈服中。究
目的分析介入性血管内栓塞术治疗腹腔镜胃癌根治术后血流动力学不稳定出血的疗效。方法选取40例腹腔镜胃癌根治术后血流动力学不稳定出血患者为研究对象,实施介入性血管内栓
新媒体时代,在高校思想政治理论课教学中运用案例教学法是非常必要的。案例开发研究是案例教学法的基础,但开发案例要遵循一定的原则,如真实性、典型性、多样化和启发性原则
最优化问题是现代数学的一个重要分支,涉及到许多不同的学科,其主要的目的是在满足一定约束条件的情况下,找到一组数值以使得系统的某些最优性度量得到满足。解决最优化问题
多发性硬化有一些发作性症状,包括痛性强直发作、Lhermitte征、感觉异常、短暂的肢体无力、复视、视力障碍、共济失调、三叉神经痛、瘙痒等。有的可以是MS的首发症状,有的提示M
<正> 【目的和设想】本单元是本册的重点单元之一,也是整个初中阶段学习说明文的最后一个重点单元(第五、六册虽有说明文,但均非重点单元)。这两篇课文都是介绍科学技术知识
在实际中,大多数系统都是非线性系统,而且通常受到不确定性,时滞以及随机扰动等因素的影响。自适应控制因其具有辨识对象和在线修改参数的能力,能够有效抑制不确定性的影响,