论文部分内容阅读
作为公共交通的重要组成部分,电动出租车对电动车推广具有重要的示范意义。相较于燃油出租车,电动出租车需要耗费更多充电时间,降低了出租车司机的使用意愿,全面推广面临较大阻力。强化学习方法方兴未艾,适用于出租车运营的顺序决策过程。基于强化学习,本文构建双深度Q学习网络(double deep Q-learning network,DDQN)模型模拟电动出租车的运行。根据出租车的实时状态选择并执行最优载客、充电、空驶和等待等动作,通过训练得到全局最优的电动出租车运营策略,实现电动出租车运营智能优化。利用美国