【摘 要】
:
在交通配时技术上,基于传统Q学习的交通信号配时策略是解决交通拥堵问题的重要手段,但其疏通交通拥堵的效果有限。为此,在传统Q学习的基础上,本文提出采用深度强化学习策略来
【基金项目】
:
辽宁省科技厅博士科研启动基金(20170520197).
论文部分内容阅读
在交通配时技术上,基于传统Q学习的交通信号配时策略是解决交通拥堵问题的重要手段,但其疏通交通拥堵的效果有限。为此,在传统Q学习的基础上,本文提出采用深度强化学习策略来优化交叉口信号配时技术,以减少交通系统中车辆数量和车辆通过交叉口的平均行驶时间;同时,应用深度强化学习策略本身具有的深度网络及引入的经验池、贪婪策略、DOUBLE DQN等方法技术,优化传统Q学习在交通配时上存在的Q值表建立和搜索、目标Q值被高估、无法学习长期经验等问题。实验结果表明,基于深度强化学习的交通信号配时策略在疏通交叉路口车辆方面优于传统Q学习策略,可以更好的疏通交通拥堵,提高交通系统效率。
其他文献
本论文是一篇歌曲翻译实践报告。蒙古族歌曲是中华民族文化里重要的组成部分,在草原文化中占有非常重要的地位,表现了草原人民真挚的感情和热情豪放的性格。对其进行译介,可
青光眼是国内外致盲的主因。眼内压过高是此病的重要危险因素。虽然高眼压的病因仍有争论,但小梁网细胞外基质的过度堆积而阻滞房水外流,使眼内压升高,是比较公认的机制。最近,利
目的:分析对比后程三维适形同期放化疗与常规同期放化疗治疗Ⅲ期非小细胞肺癌(non-small cell lung cancer,NSCLC)的疗效和不良反应。方法:回顾性分析87例Ⅲ期NSCLC患者随机分为后
变压器是电力行业中需要利用的重要设备,对于供电稳定和电能利用率的提升有重要的帮助.就目前的具体分析来看,我国电力工程建设中主要使用的高频变压器其存在着耗能高、体积
时与体一直是语言学研究和英语教学中的难点和重点。虽然时和体的研究意义重大,但是研究却主要集中在语篇结构、小句类型、认知语言学和社会语言学等方面。尽管时与体的研究
在采用情境方式进行教学,主要就是通过创设情境、和有趣生动的形象进行教学,从而营造一种有趣、活跃的课堂气氛,这样可以极大的提高学生的学习兴趣,同时加深他们对知识的理解
当前社会,一方面园艺专业招工难,另一方面学生就业对口率低。本文分析了园艺专业存在这一现象的主要原因,并介绍了嘉兴职业技术学院园艺专业学徒班办学经验。力求通过学徒班