一种基于分布式强化学习的多智能体协调方法

来源 :计算机仿真 | 被引量 : 0次 | 上传用户：hongdou0219

【摘要】

：

多智能体系统研究的重点在于使功能独立的智能体通过协商、协调和协作,完成复杂的控制任务或解决复杂的问题.通过对分布式强化学习算法的研究和分析,提出了一种多智能体协调

【作者】

：

范波潘泉张洪才

【机构】

：

西北工业大学自动控制系

【出处】

：

计算机仿真

【发表日期】

：

2005年6期

【关键词】

：

多智能体系统分布式强化学习多智能体协调

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多智能体系统研究的重点在于使功能独立的智能体通过协商、协调和协作,完成复杂的控制任务或解决复杂的问题.通过对分布式强化学习算法的研究和分析,提出了一种多智能体协调方法,协调级将复杂的系统任务进行分解,协调智能体利用中央强化学习进行子任务的分配,行为级中的任务智能体接受各自的子任务,利用独立强化学习分别选择有效的行为,协作完成系统任务.通过在Robot Soccer仿真比赛中的应用和实验,说明了基于分布式强化学习的多智能体协调方法的效果优于传统的强化学习.

其他文献

管理战略在体育赛事规划和管理中的应用——以墨尔本为例

<正>随着体育赛事的规模不断扩大,赛事组织机构日益复杂,体育赛事的商业化特征日趋强化,将战略管理的理念引入体育赛事中,尤其是现代大型国际体育赛事中,则显得尤为必要。大

会议

英国警示托伐普坦(Samsca)有导致血清钠升高过快及严重神经系统不良事件的风险

托伐普坦（Samsca）是一种选择性血管加压素V2-受体拈抗剂。于2009年在英国注册，用于治疗继发的抗利尿激素分泌（SIADH）不足的低钠血症成人患者，剂量为15～60mg每日一次。

期刊

托伐普坦Samsca不良事件神经系统

柯达推出TRILLIAN SP热敏印版亮相北方展自动化印前工作流程实现事半功倍

7月27日,图文影像行业巨头柯达携旗下的新一代高性能、无需预热的阴图印版技术——全新柯达TRILLIAN SP热敏印版在第五届中国（北方）印刷及设备器材展亮相,此款印版将为商业印刷

期刊

TRILLIAN热敏印版印前工作流程柯达北方SP自动化商业印刷

公安改革和四项建设背景下入警训练标准化研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

标准化标准化体系警务实战基础训练标准化体系

静脉泵注丙泊酚-氯胺酮麻醉在小儿疝气手术中的应用

目的观察静脉泵注丙泊酚-氯胺酮麻醉在小儿疝气手术中的应用效果。方法选择120例行疝囊高住结扎术或疝修补术的忠儿，ASAⅠ～Ⅱ级，先给予静注氯胺酮1～2mg／kg进行麻醉诱导，继以丙泊酚4

期刊

丙泊酚氯胺酮静脉泵注麻醉小儿疝气手术

《厦门大学学报(自然科学版)》 1994—1996年载文分析

对《厦门大学学报(自然科学版)》1994—1996年3年载文共18期进行回顾性分析,并对刊用率、发表周期、载文分类等项进行统计,其中稿件的平均刊用率为72.52%,论文平均发表周期为

期刊

载文统计分析质量

固脑益智汤联合多奈哌齐治疗老年肾虚痰浊型血管性痴呆的临床疗效

期刊

肾虚痰浊型血管性痴呆固脑益智汤多奈哌齐

建筑工程造价超预算的原因及控制对策

为了更好地确保工程造价得到有效的控制,作为建筑工程造价管控人员,必须对建筑工程造价超预算的原因有一个全面的认识,才能针对存在的问题采取有效的措施予以控制。

期刊

建筑工程造价超预算原因控制对策

天津港整合煤化工资源助推产业发展

本文从世界能源发展趋势讲到我国能源构成及煤制油工业、煤气化，结合天津港的实际情况，总结了天津港煤化工产业对策。

期刊

煤化工方向天津港发展

乌鲁木齐市初中纪律教育的现状研究与思考

改革开放三十年,我国进入了建设和谐社会的重要时期。和谐社会的建设需要既有个性又有社会责任感的具有高尚公民道德的人的参与。纪律教育对于培养学生的纪律精神至关重要,但

学位

纪律教育初中乌鲁木齐

一种基于分布式强化学习的多智能体协调方法

与本文相关的学术论文