局部合作多智能体Q-学习研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:tzt333333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习在多Agent系统中面对的最大问题就是随着Agent数量的增加而导致的状态和动作空间的指数增长以及随之而来的缓慢的学习效率。采用了一种局部合作的Q-学习方法,只有在Agent之间有明确协作时才考察联合动作,否则,就只进行简单的个体Agent的Q-学习,从而使的学习时所要考察的状态动作对值大大减少。最后算法在捕食者-猎物的追逐问题和机器人足球仿真2D上的实验结果,与常用的多Agent强化学习技术相比有更好的效能。
其他文献
曾经,哲学专业一直是文科状元的理想。如今,这曾经的“思想殿堂”却成为调剂专业的“收容所”。根据《2017年全国研究生招生数据调查报告》,从2010年到2015年硕士研究生各学科(不
普京和布什是一代新的国家领导人。尽管俄美两国的政治制度不同,社会发展道路相异,两人的个性和脾气也不相同,但他们都是'少壮派',不仅年少气
奶源是供应链的起点,也是后续生产和销售环节的保障.本研究对唐山市场原料乳进行卫生质量调查与检测,结果表明,某地市场原料奶质量均符合国家收购标准,同时本次试验也为原料乳的溯
如今,中国农村的温饱问题已基本解决,民主进程正在不断深入推进,构建社会主义和谐社会既是党中央、国务院的重大部署,也是亿万百姓的殷切期盼。随州市曾都区开展“农民讲坛”
期刊
为克服目前动态背景建模方法中计算量和存储量大的问题,提出了一种基于聚类的动态背景建模与运动目标分割方法。由于动态背景下每个像素的取值在时间轴上呈多峰分布形式,因此
什么叫"办公"?词典解释是"处理公事"。显而易见,到办公室上班,是"公事公办":是"上情下达、下情上传",是撰写文字材料,是接待来信来访者
期刊
党的十六届六中全会通过的《关于构建社会主义和谐社会若干重大问题的决定》明确提出,要“拓宽社情民意表达渠道,推行领导干部接待群众制度,完善党政领导干部和党代表、人大
期刊
就业是民生之本,社区作为社会的基础、城市的细胞,在增加就业机会这方面起着重要的作用。改革开放以来,社区就业作为一种新的就业形式为扩大就业提供了机会。当前,我国就业形
期刊
针对当前网格调度体制的研究仅从功能需求、执行过程方面进行描述,尚未对调度过程中的接口和交互协议进行定义,缺乏对语义支持的现状。结合语义Web服务技术,从实现角度讨论服务
粘连性是篇章研究中常用的一个术语。Hallliday和Hason认为,如果对篇章中某一语言成分的理解取决于对篇章中另一语言成分的理解,那么这两个语言成分之间结成的关系便是一种粘
期刊