基于内在动机的智能机器人自主发育算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:daolong163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对两轮自平衡机器人在学习过程中主动性差的问题,受心理学内在动机理论启发,提出一种基于内在动机的智能机器人自主发育算法。该算法在强化学习的理论框架中,引入模拟人类好奇心的内在动机理论作为内部驱动力,与外部奖赏信号一起作用于整个学习过程。采用双层内部回归神经网络存储知识的学习与积累,使机器人逐步学会自主平衡技能。最后针对测量噪声污染对机器人平衡控制中两轮角速度的影响,进一步采用卡尔曼滤波方法进行补偿,以提高算法收敛速度,降低系统误差。仿真实验表明,该算法能够使两轮机器人通过与环境的交互获得认知,成功地学会运
其他文献
触碰式橄榄球是国际橄榄球理事会向南京市青少年推广的一个新兴项目,“完全安全”的游戏规则汇聚了英式橄榄球的精华,是一种融合竞技、文化与智力的运动。文章概述了触碰式橄榄
针对环境规制中地方政府与中央政府之间的行为互动,从演化博弈论的研究视角探讨了地方政府与中央政府的决策演化过程。通过建立地方政府与中央政府的非对称演化博弈模型,考察了
代数知识是在算术知识的基础上发展起来的,其特点是用字母表示数,使数的概念及其运算法则抽象化和公式化.学生在学习的时候会产生一些困难,特别是初一学生刚刚接触代数,对代
以一对减速箱体相互啮合的渐开线直齿轮为研究对象,运用PRO/E和ANSYS Workbench建立渐工线直齿轮三维模型和有限元模型,再利用ANSYS Workbench有限元分析软件对标准齿轮的啮
二十世纪末,我国政府颁布了关于《禁毒的决定》的相关规定,这个规定在法律上对相关的犯罪人员的罪名处理做出了一个界定。毒品带给人们的危害不言而喻,不仅对人们的身心健康
为了优化新田煤矿近距离突出煤层群首采层和瓦斯抽采巷层位,基于新田煤矿已有地质资料,结合新田煤矿瓦斯治理技术,探讨了瓦斯抽采巷布置在1^#~12^#煤层之间不同方案的可行性;
脑啡肽酶是一个含锌离子的Ⅱ型膜蛋白金属内肽酶。近年来,大量实验研究显示脑啡肽酶抑制剂通过抑制脑啡肽酶的活性,发挥抑制利钠因子、改善血管内皮功能、抗动脉粥样硬化、抗
目的应用支气管肺泡灌洗技术(broncho-alveolar lavage,BAL)对重症肺部感染呼吸衰竭行机械通气治疗的患者进行诊治,观察临床应用价值及对病原学诊断的意义,及安全性观察。方法
英语习语是英语民族长期积累下来的一种约定俗成的语言形式,其中蕴含着大量的隐喻。该文以表示"高兴"和"悲伤"的习语为例,对习语中的隐喻现象进行了分析。分析表明,隐喻在习
高职学生是环境教育的重点对象,其环境素质对我国生态文明建设具有重要影响。高职环境教育在教育内容、教育形式、教育实践方面与生态文明建设需要还存在一定差距,需要在加强