基于Agent的递阶强化学习模型与体系结构

来源 :机械工程学报 | 被引量 : 0次 | 上传用户:lilinli2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过引入频率最大Q值启发式学习算法,对一种递阶强化学习方法进行改进,解决在庞大状态空间和动态变化环境中对Agent进行最优行为策略学习的问题。引入属性维护算子以及承诺和规划意识属性,对经典信念、愿望、意图模型进行扩展,给出意识属性的理性维护过程,增强Agent的自适应性并使Agent具有在动态环境中进行在线学习的能力。根据意识模型提出一种具有主动性、适应性、反应性、社会性的Agent体系结构,并根据该体系结构开发出一种路径规划Agent。通过对行驶环境的组态设定,模拟车辆复杂的行驶状态,并通过对行驶状态的
其他文献
利用磴口县2008-2017年白粉病发生资料及气象资料,采用逐步回归、多元回归法建立预报方程,并进行历史拟合,为磴口华莱士瓜白粉病预报服务提供参考.
在清中期的紫砂壶艺史上,最具代表性的要数陈曼生与杨彭年合作所制的壶.这种由陈曼生设计,由杨彭年制作,再由曼生及其友人题铭的砂壶被称为“曼生壶”或“曼壶”,由于其造型简洁,制
为了解决操作机和夹持系统性能设计中可行抓取力和承载条件计算问题,研究过约束、超静定条件下的接触力建模和抓取分析方法。基于抓取的接触动力学约束,采用拉格朗日乘子方法
由于微尺度领域材料的力学性能存在尺度效应,使得微梁的动力学性态较传统的大尺寸柔性梁的动力学性态呈现明显的不同。对中心转动刚体、柔性微梁组成的刚体—微梁一类刚柔耦