融合神经元激励机制的机器人情景学习与行为控制

来源 :机器人 | 被引量 : 0次 | 上传用户:babycat_hj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不确定环境下机器人行为控制的维数灾难和感知混淆问题,引入神经元激励机制,提出一种情景记忆驱动的马尔可夫决策过程(EM-MDP)以实现机器人对环境经验自主学习,及多源不确定性条件下的行为控制.首先,构建情景记忆模型,并基于认知神经科学提出事件中状态神经元激活及组织机制.其次,基于自适应共振理论(ART)与稀疏分布记忆(SDM)通过Hebbian规则实现情景记忆的自主学习,采用神经元突触势能建立机器人行为控制策略,机器人能够评估过去的事件序列,预测当前状态并规划期望的行为.最后,实验结果验证,该模型框架与控制策略能够实现机器人在普遍场景中的行为控制目标. Aimed at the problem of dimensionality disaster and perceived confusion of robot behavior control in uncertain environment, a neuron-based incentive mechanism is introduced and a scenario-memory-driven Markov Decision Process (EM-MDP) is proposed to realize robot’s autonomous learning of environmental experience. Behavioral control under multi-source uncertaintiesFirstly, a scenario memory model was constructed and neuron activation and organization mechanism was proposed based on cognitive neuroscience.Secondly, based on adaptive resonance theory (ART) and sparse distribution memory SDM) to autonomic learning of contextual memory through Hebbian rules, using the synaptic potential of neurons to establish a robot behavior control strategy, the robot can evaluate the past sequence of events, predict the current state and plan the expected behavior.Finally, the experimental results show that the model framework And control strategy to achieve the goal of behavior control of robots in common scenarios.
其他文献
目的药效与化学指标相结合优选复方五仁醇胶囊含药血清制备方法。方法建立CCl4诱导的大鼠肝细胞损伤模型,采用L8(27)正交设计给药和取血方案,制备大鼠含药血清或血浆,考察含
<正>大动脉炎是周围血管科最常见疾病之一,为慢性、非特异性炎症,根据病变部位可分为头臂动脉型,胸、腹主动脉型,广泛型和肺动脉型,临床多以局部动脉狭窄或闭塞所致缺血为主
<正> 明定陵共出土5件带钩,按质料可分玉、玛瑙和木质3类。 玉带钩 2件,分别由白玉、碧玉制成其中白玉带钩,通长14.2厘米,钩长3.6厘米,腹宽2.5厘米。碧玉带钩,通长11厘米,钩
期刊
<正> 故宮博物院最近挙辦的《近代“四任”繪畫陳列》(按:即任熊、任薰、任頤、任預)中,有一件任熊的《麻姑獻壽圖》,以其誇張的手法、奇古的形象,濃艷的色澤,引人注目。這件
为了改善防火涂料膨胀炭质层蓬松易脱落和易开裂的缺点,将可膨胀石墨添加到防火涂料中,通过对可膨胀石墨和基料、P-C-N化学膨胀阻燃体系匹配的研究,讨论了可膨胀石墨的细度、
随着国内外汽车市场规模的持续增长,汽车电子系统的复杂度和价值量也在不断提升。在汽车电子系统中各项技术迅速更迭的同时,高级驾驶辅助系统ADAS也正在逐渐改变着传统的汽车
农村集体资产管理涉及到广大农民群众的核心利益,同时也是国家大力推动农村发展背景下社会大众普遍关注的热点焦点问题,要想实现农村集体资产管理的制度化、科学化、信息化,
在德国高等教育改革中,虽然引入了被国外验证行之有效的英美竞争机制和资源配置模式,然而由于德国在文化和高等教育传统上与其他国家的差异,这一模式短时间内在德国高等教育
基于企业网络的经济和区域发展理论是一种有关区域和经济发展的新理论。该理论主要侧重于从中观层次来论述和说明区域和经济发展的过程。区域的持续竞争优势取决于该区域能否
基于Internet环境,应用数据仓库和数据挖掘技术,本文构建了一个企业财务管理决策支持系统框架,提出了系统的体系结构.