Q学习在单路口交通信号控制中的应用研究

来源 :长沙理工大学 | 被引量 : 11次 | 上传用户:ccf107893228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前交通拥堵现象在国内外各种城市中频频发生,要解决这种现象,必然要加强交通控制与管理。在城市交通中,单路口信号控制构成了交叉口线控和面控的基础,是国内外研究的热点。本文针对智能体技术应用于交通信号控制方法展开相关研究,主要工作涉及以下几个方面:在充分学习强化学习原理的基础上,主要对利用Q学习算法进行交通信号控制的5个关键问题进行了探讨,并重点解决了利用Q学习算法所需要的状态空间的离散化,同时也构建了基于Q学习的单路口交通信号控制体系。根据Q学习算法的原理,提出了基于各相位绿灯时间变化的三种动作:增加当前相位绿灯时间Δ秒,保持不变,减少当前相位绿灯时间Δ秒。各个相位分别采用三种动作组成的方案,构成状态转化后的控制动作集。采用此控制动作集,基于周期变化与否,分别建立了以车均延误最小为目的的两个奖惩函数,并提出两种不同的Q学习交通信号控制算法:固定周期与可变周期的Q学习算法。对该信号控制算法进行设计后,给出了算法详细步骤。通过Matlab编程,以一个典型4相位控制的单路口作为算例,分别以固定周期与可变周期的Q学习算法进行信号配时,与Webster法进行了对比,验证了单路口利用Q学习进行交通信号控制的算法具有较好的控制效果。本文最后对研究工作进行了总结,指出了今后需进一步深入研究的问题。
其他文献
随着我国科技技术的不断进步,经济发展也在不断提升,光纤通信工程已经逐渐拓展为我国民生工程中的一部分,具有较为重要的作用。当前,光纤通信工程的质量在逐渐提升,光纤通信
随着科学技术和工业生产的迅猛发展,产品质量越来越成为企业获得成功的关键因素。稳健性设计优化作为持续质量改进的重要支撑技术,在产品开发设计过程中加以实施,能够有效的
对硅酸锆粉体制备技术的研究现状做了系统的概述,着重介绍了目前硅酸锆粉体制备中应用较多的固相法、沉淀法、水热法、溶胶-凝胶法、非水解溶胶-凝胶法等几种方法,简要地分析
目的研究中药热敷结合手法按摩治疗脑卒中后肩手综合征与传统针灸疗法的疗效差别。方法随机选取2011年1月至2014年12月我院收治的56例患者,均有脑卒中后肩手综合征Ⅰ期的症状
随着连续刚构桥跨度的增大,最大悬臂施工长度越来越长刚度也随之下降,因此风致振动问题显得越来越重要。本文以温福铁路主跨160m的田螺大桥为工程背景,针对施工最大悬臂状态
自20世纪90年代以来,随着电信产业突飞猛进的发展,整个行业已处于网络产业激励性规制改革的前沿,电信产业的规制与竞争理论成为现代经济学最受关注的焦点之一,作为监管与规制
目的:讨论和分析糖尿病足的分期及临床治疗疗效。方法:选取2012年1月-2013年12月在我院接受治疗的糖尿病足患者189例为研究对象,随机分成两组,分别采用中医分期辨治为主的综
瞬态热阻抗是表征IGBT模块热特性的重要参数,瞬态热阻抗的退化可以反映模块材料的退化,因此研究IGBT瞬态热阻抗的退化模型对IGBT状态评估、寿命预测等研究有重大意义。利用温
金融危机对于银行业的冲击力度不言而喻。本文以2008年金融危机发生后对美国银行体系造成的影响为例,得出金融危机对于中国银行业的几点启示。
桥面铺装层作为桥梁工程的附属结构,设计与施工仍沿用传统的路用沥青棍合料的做法,现行沥青路面设计规范对沥青铺装结构组合的设计主要从材料、做法及厚度等方面作了指导性说