基于Agent的递阶强化学习模型与体系结构

来源 :机械工程学报 | 被引量 : 0次 | 上传用户：lilinli2

【摘要】

：

通过引入频率最大Q值启发式学习算法,对一种递阶强化学习方法进行改进,解决在庞大状态空间和动态变化环境中对Agent进行最优行为策略学习的问题。引入属性维护算子以及承诺和

【作者】

：

王文玺肖世德孟祥印陈应松张卫华

【机构】

：

谣南交通大学机械工程学院,西南交通大学牵引动力国家重点实验室

【出处】

：

机械工程学报

【发表日期】

：

2010年2期

【关键词】

：

AGENT 强化学习体系结构意识模型 Agent Reinforcement learning Architecture Consciousness mod

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过引入频率最大Q值启发式学习算法,对一种递阶强化学习方法进行改进,解决在庞大状态空间和动态变化环境中对Agent进行最优行为策略学习的问题。引入属性维护算子以及承诺和规划意识属性,对经典信念、愿望、意图模型进行扩展,给出意识属性的理性维护过程,增强Agent的自适应性并使Agent具有在动态环境中进行在线学习的能力。根据意识模型提出一种具有主动性、适应性、反应性、社会性的Agent体系结构,并根据该体系结构开发出一种路径规划Agent。通过对行驶环境的组态设定,模拟车辆复杂的行驶状态,并通过对行驶状态的

其他文献

磴口华莱士瓜白粉病预报模型研究

利用磴口县2008-2017年白粉病发生资料及气象资料,采用逐步回归、多元回归法建立预报方程,并进行历史拟合,为磴口华莱士瓜白粉病预报服务提供参考.

期刊

白粉病中心病株气象因子预报方程Powdery mildewCenter disease plantMeteorological factorsPr

曼壶撷英录

在清中期的紫砂壶艺史上，最具代表性的要数陈曼生与杨彭年合作所制的壶．这种由陈曼生设计，由杨彭年制作，再由曼生及其友人题铭的砂壶被称为“曼生壶”或“曼壶”，由于其造型简洁，制

期刊

陈曼生曼生十八式杨彭年设计题识Chen Mansheng Eighteen Kinds Of Man Sheng Teapot Yang Peng

力抓取的接触力建模与可行抓取力分析

为了解决操作机和夹持系统性能设计中可行抓取力和承载条件计算问题,研究过约束、超静定条件下的接触力建模和抓取分析方法。基于抓取的接触动力学约束,采用拉格朗日乘子方法

期刊