Timesharing-tracking Framework for Decentralized Reinforcement Learning in Fully Cooperative Multi-a

来源 :IEEE/CAA Journal of Automatica Sinica | 被引量 : 0次 | 上传用户：zhiyouyiren

【摘要】

：

Dimension-reduced and decentralized learning i always viewed as an efficient way to solve multi-agent cooperative learning in high dimension. However, the dynam

【作者】

：

Xin Chen Bo Fu Yong He Min

【机构】

：

School of Automation,China University of Geo sciences; School of Information Science and Engine

【出处】

：

IEEE/CAA Journal of Automatica Sinica

【发表日期】

：

2004年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Dimension-reduced and decentralized learning i always viewed as an efficient way to solve multi-agent cooperative learning in high dimension. However, the dynamic environmen brought by the concurrent learning makes the decentralized learning hard to converge and bad in performance. To tackle thi problem, a timesharing-tracking framework(TTF), stemming from the idea that alternative learning in microscopic view results in concurrent learning in macroscopic view, is proposed in this paper, in which the joint-state best-response Q-learning(BRQ-learning) serves as the primary algorithm to adapt to the companions policies. With the properly defined switching principle, TTF makes all agents learn the best responses to others at different joint states. Thus from the view of the whole joint-state space, agents learn the optimal cooperative policy simultaneously. The simulation results illustrate that the proposed algorithm can learn the optimal joint behavior with les computation and faster speed compared with other two classica learning algorithms.

其他文献

常用尿动力学检查在法医临床鉴定中的应用

尿动力学检查是依据流体力学和电生理学的基本原理,通过检测尿路各部位压力、流率及生物电活动,检测尿路功能及排尿障碍的病理生理学变化过程的检查方法。本文主要目的是介绍

期刊

法医临床学尿动力学检查尿道狭窄神经源性膀胱

支持性护理干预对分娩期女性分娩恐惧与分娩结局的影响

目的探讨支持性护理干预对分娩期妇女分娩恐惧与分娩结局的影响。方法选择2017年1~12月定期产检的120例分娩期女性,按照随机数字表法分为支持性护理干预组(试验组,n=60)和常

期刊

支持性护理分娩分娩恐惧分娩结局

具有优良高温性能的涡轮用TiAl合金——DAT-TA3的开发

日本大同特殊钢公司自1994年于世界上首次用TiAl合金制造了商用汽车涡轮增压器的涡轮以来,已经生产了超过12000个TiAl合金涡轮。但随着燃耗要求的不断提高,汽车涡轮发动机必

期刊

DAT-TA3高温性能

论贾樟柯电影《江湖儿女》中的符号叙事模式

作为第六代导演的领军者,贾樟柯以其独特的叙事特色享誉中外,在他的电影《江湖儿女》中,贾樟柯导演以其独特的符号叙事模式对当代中国电影的叙事进行了创新。这部电影中的符

期刊

贾樟柯《江湖儿女》符号叙事

西南三种不同形态的阳戏及其演化

阳戏为我国西南地区广泛流播的一种民间文化形式,其形态多样,依照与"仪式性"的亲疏关系,可划分为"以戏附仪、仪戏结合、隐仪显戏"三种。三种形态的阳戏层次清晰地依次流布在

期刊

阳戏阳戏形态仪式性戏剧化演化

薪酬管理在企业管理中存在的问题与对策

本文分析了薪酬管理的构成因素与在企业管理中的重要作用，系统地提出了当前企业在薪酬管理方面存在的主要问题，并提出了相应的对策。

期刊

人力资源管理薪酬管理核心竞争力对策

西方蜜蜂生产蜂王浆中10-HDA含量调查研究

10-HDA是《蜂王浆》国家标准主要理化指标之一。2008年3月至2009年4月，在我国蜂王浆主产区160个蜂场采集蜂王浆样品160份。140份蜂王浆样品中10-HDA含量经比较分析，结果表明：蜂

期刊

蜂王浆10-HDA含量调查

浅谈古筝表演与音乐美学原则的结合

随着新时期教育体制改革进程的有序推进,专业课程教学等方面也在不断进行改革与探索。在古筝表演中,不仅要注重培养表演者的技艺,同时还应当把握基本的原则和方法,并结合表演

期刊

音乐美学古筝表演结合关系展示

河道清草机的研制

根据WH1800河道清草机研制情况,介绍了该设备技术参数,对水草收集、输送、滚压、排放、航行的基本原理进行了理论分析,对机具使用和水草清理方法提出了自己的观点.该研究成果

期刊

清草机研制原理

浅论“资本主义世界体系”

'资本主义世界体系'是中学<世界近代现代史>教材的核心概念和主要内容之一,与此相似而又有密切联系和区别的概念还有'资本主义世界殖民体系'、'资本主义

期刊

世界近代现代史初步形成不平等性世界体系半殖民地世界经济体系工业革命封建主义帝国主义阶段

Timesharing-tracking Framework for Decentralized Reinforcement Learning in Fully Cooperative Multi-a

与本文相关的学术论文