一种基于分布式强化学习的多智能体协调方法

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:hongdou0219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多智能体系统研究的重点在于使功能独立的智能体通过协商、协调和协作,完成复杂的控制任务或解决复杂的问题.通过对分布式强化学习算法的研究和分析,提出了一种多智能体协调方法,协调级将复杂的系统任务进行分解,协调智能体利用中央强化学习进行子任务的分配,行为级中的任务智能体接受各自的子任务,利用独立强化学习分别选择有效的行为,协作完成系统任务.通过在Robot Soccer仿真比赛中的应用和实验,说明了基于分布式强化学习的多智能体协调方法的效果优于传统的强化学习.
其他文献
<正>随着体育赛事的规模不断扩大,赛事组织机构日益复杂,体育赛事的商业化特征日趋强化,将战略管理的理念引入体育赛事中,尤其是现代大型国际体育赛事中,则显得尤为必要。大
会议
托伐普坦(Samsca)是一种选择性血管加压素V2-受体拈抗剂。于2009年在英国注册,用于治疗继发的抗利尿激素分泌(SIADH)不足的低钠血症成人患者,剂量为15~60mg每日一次。
7月27日,图文影像行业巨头柯达携旗下的新一代高性能、无需预热的阴图印版技术——全新柯达TRILLIAN SP热敏印版在第五届中国(北方)印刷及设备器材展亮相,此款印版将为商业印刷
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的观察静脉泵注丙泊酚-氯胺酮麻醉在小儿疝气手术中的应用效果。方法选择120例行疝囊高住结扎术或疝修补术的忠儿,ASAⅠ~Ⅱ级,先给予静注氯胺酮1~2mg/kg进行麻醉诱导,继以丙泊酚4
对《厦门大学学报(自然科学版)》1994—1996年3年载文共18期进行回顾性分析,并对刊用率、发表周期、载文分类等项进行统计,其中稿件的平均刊用率为72.52%,论文平均发表周期为
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
为了更好地确保工程造价得到有效的控制,作为建筑工程造价管控人员,必须对建筑工程造价超预算的原因有一个全面的认识,才能针对存在的问题采取有效的措施予以控制。
本文从世界能源发展趋势讲到我国能源构成及煤制油工业、煤气化,结合天津港的实际情况,总结了天津港煤化工产业对策。
改革开放三十年,我国进入了建设和谐社会的重要时期。和谐社会的建设需要既有个性又有社会责任感的具有高尚公民道德的人的参与。纪律教育对于培养学生的纪律精神至关重要,但