A new accelerating algorithm for multi-agent reinforcement learning

来源 :Journal of Harbin Institute of Technology | 被引量 : 0次 | 上传用户：khsim

【摘要】

：

In multi-agent systems, joint-action must be employed to achieve cooperation because the evaluation of the behavior of an agent often depends on the other agent

【作者】

：

张汝波仲宇顾国昌

【机构】

：

ComputerScienceandTechnologyCollege,RoboticsLaboratory

【出处】

：

Journal of Harbin Institute of Technology

【发表日期】

：

2005年1期

【关键词】

：

运算法则机械学习能力人工智能系统数学模拟技术机器人 distributed reinforcement learning accelerating al

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

In multi-agent systems, joint-action must be employed to achieve cooperation because the evaluation of the behavior of an agent often depends on the other agents' behaviors. However, joint-action reinforcement learning algorithms suffer the slow conve

其他文献

基于局域共振机制的平面型金属-电介质电磁波带隙结构的实验研究

研究了具有高阻抗的电磁带隙（EBG）的双层平面型金属-电介质周期性单元结构,此类结构的特定频率的表面波抑制和同相位反射性质在微波天线及高速电路中有广阔应用前景.本文根据Si

期刊

电磁带隙局域共振几何参数Electromagnetic bandgap （EBG） Local resonance Geometrical param

基于GIS和土地质量地球化学数据的水稻种植适宜性评价——以安徽省青阳县为例

为加快安徽省青阳县的高标准基本农田建设,开展更加精准的水稻种植适宜性评价,本文根据研究区土地质量地球化学数据和当地水稻对生长环境的需求,通过层次分析法(AHP)把水稻种

期刊

水稻种植适宜性土地质量土壤重金属GIS青阳县

Fair data scheduling in OFDM wireless networks based on maximizing utility

This paper proposes a joint layer scheme for fair downlink data scheduling in multiuser OFDM wireless networks. Based on the optimization model formulated as th

期刊

OFDM接头分层最优化处理DSAfairness scheduling OFDM utility function joint layer optimi

Maneuver and vibration reduction of flexible spacecraft using sliding mode/command shaping technique

期刊

减振CSVSSMC柔性航天器姿态机动自动控制vibration reductioncomponent synthesis vibration sup

荒漠植物中总脱氧核糖核酸分子的提取方法

建立了荒漠植物总脱氧核糖核酸分子(DNA)的提取方法.荒漠植物叶片加少量交联聚乙烯吡咯烷酮(PVPP粉末)研磨三次以上,得到样品超细粉末.样品粉末迅速加入前处理缓冲液,混匀后

期刊

荒漠植物总脱氧核糖核酸分子提取desert plantDNAextraction

巩固成果再接再厉推进农垦扶贫开发工作再上新台阶——农业部副部长高鸿宾在全国农垦扶贫开发工作会议上的讲话摘要

2005年以来,各垦区和贫困农场以邓小平理论和＂三个代表＂重要思想为指导,深入贯彻落实科学发展观,坚持以人为本,以发展壮大农场经济、提高职工群众生活水平和构建垦区和谐社会为

期刊

扶贫开发副部长农业部农业综合生产能力农垦农场经济摘要会议

后金融危机时代安徽职业教育发展困境原因分析及对策研究

本次国际金融危机使得发达地区加速向中西部进行产业转移,安徽作为产业转移的桥头堡和中间枢纽,无疑具有地域优势。安徽应随产业转移和城市化进程加快而起舞,并审时度势及早

期刊

后金融危机时代安徽职业教育产业转移经济结构校企共担

用修正的UTD模型预测室内电波传播

分析了现有预测室内电波传播的2-D／3-D混合算法模型的不足，提出一种修正模型，该模型建立在环境的二维对地平面图基础上。在建立可见性树时，结合实际三维环境的特点引入分别相对于

期刊

室内电波传播预测射线跟踪可见性树Indoor propagation prediction Ray tracing Visibility tree

分层基片集成波导功分器及宽带功率放大器研制

基于矩形金属波导-多层基片集成波导（RWG—MLSIW）功分器技术实现了宽带功率合成。RWG-ML—SIW结构组成比较简单，就是将一组基片集成波导层叠并紧密地插入到矩形金属波导内，通过这

期刊

矩形金属波导基片集成波导功分器合成器有源器件Rectangular waveguide（RWG） Substrate integrated wave

努力建设农垦高素质职工人才队伍

农垦事业伴随伟大祖国日新月异的快速发展进入了新的历史时期。发展现代农业、推进社会主义新农村建设、构建社会主义和谐社会，迫切需要建设一支规模结构合理、素质能力优良的

期刊

人才队伍建设农垦职工素质社会主义现代农业人才资源农村建设

A new accelerating algorithm for multi-agent reinforcement learning

与本文相关的学术论文