论文部分内容阅读
提出了能量管理策略优化方法,通过深度强化学习中的深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法调整等效因子,以提高燃油利用率,达到SOC保持与油耗降低的目标。受到边缘计算架构启发,建立了基于并行的深度强化学习算法以加快学习速度。在FTP72工况的仿真结果表明:提出的算法使油耗相对基于PID控制器的传统A-ECMS算法降低了7.2%,而以边缘计算架构建立的并行深度强化学习算法使收敛速度提高了334%。