多代理强化学习相关论文
自动驾驶车辆的感知能力,计算能力和通信能力是有限的,它无法获得更大范围的交通态势信息,无法部署计算复杂度高的多车协同算法。......
在分析了多代理强化学习的基础上,提出了一种基于对手策略假设的代理最优响应强化学习规则,并证明了当对手策略满足一定条件时,基......