多代理强化学习相关论文
							
							
                                 自动驾驶车辆的感知能力,计算能力和通信能力是有限的,它无法获得更大范围的交通态势信息,无法部署计算复杂度高的多车协同算法。......
                                
                                
                            
                                 在分析了多代理强化学习的基础上,提出了一种基于对手策略假设的代理最优响应强化学习规则,并证明了当对手策略满足一定条件时,基......
                                
                                
                            
