基于强化学习的汇流瓶颈区可变限速策略研究

来源 :交通运输系统工程与信息 | 被引量 : 0次 | 上传用户:jitlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高高速公路汇流瓶颈区的通行效率,本文结合强化学习无需建立模型,具有智能学习的特点,对瓶颈区的可变限速策略进行了优化,首次提出了基于Q学习算法的可变限速控制策略.策略以最大化系统总流出车辆数为目标,通过遍历交通流状态集合,尝试不同限速值序列进行自适应学习.以真实路段交通流数据搭建了元胞传输模型仿真平台,通过将其与无控制和基于反馈控制的可变限速策略进行对比,对Q学习策略的控制效果进行评价.通行时间的降低和交通参数的变化表明,强化学习控制策略在提高汇流瓶颈区通行效率和改善交通流运行状况方面具有优越性.
其他文献
如今,我们处于一个知识爆炸的时代,学校教育已难以满足社会对继续教育的需求。我国不断出台一系列政策来促进终身教育发展和全民素质提高,这是我国社会发展的必然要求和趋势
<正>福建省人社厅日前发布消息,决定从即日起至春节前,在全省范围内组织开展农民工工资支付情况专项检查。此次专项检查以房建、市政、交通、水利、铁路等工程建设领域和劳动
20世纪30年代中后期,由中国左翼知识分子和自由主义者共同发起的新启蒙运动,从结束至今已有70余年的历史。70多年来,特别是最近一二十年来,学术界有关新启蒙运动的研究取得了
详细综述了现有的机器人行为选择方法及国内外研究现状,并讨论了行为选择机制研究发展的趋势,特别对受生物启发的机器人行为选择机制作了重点介绍.文章最后分析了机器人行为
中国正处于社会经济剧烈转型的时期。国内外学者都做了大量的思考,并走进农村,研究中国农村与农民问题,从理论到实践都提出了一些有效可行的解决办法。但散布在全中国的数百
由于烯烃环氧化物在多领域的广泛应用,人们在烯烃的环氧化反应方面做了大量的工作。反应催化剂的研究无疑是工作的重中之重,因为绝大部分的烯烃环氧化反应都是需要催化剂来催
采用有机苹果酸(C4H6O5)和还原剂H2O2作为浸出剂,对废旧锂离子电池三元正极材料的酸浸过程进行研究,从苹果酸浓度、还原剂用量、固液比、浸出时间和浸出温度等5个方面对浸出条件
<正>(文化基石+产品保障+教育推动+责任承担)×(网络工具+体验营销+年轻化战略)=未来安利≈未来直销2015年对中国直销行业来说是一个非常特别的年份,不但是中国直销重新立法
侨民与保护侨民的美军,是民国时期美国维持在华存在的重要标志。中日战争全面爆发后,战火迅速从平津蔓延至京沪等地。这些地方是美国在华侨民的集中居住地,美国政府对美侨安
<正>2016年8月16日,我国成功发射世界首颗量子卫星"墨子号",标志我国广域量子通信体系的初步建成,且处于世界先进水平.量子通信的安全性基于量子物理的基本原理,即单光子的不