基于强化学习的城市道路交叉口信号控制方法研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:l444715055
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
道路交叉口是城市交通路网中的关键节点,车辆在交叉口区域频繁的启停以及加减速使得交叉口车辆通行效率降低,并导致该区域的尾气浓度明显高于其他区域。交通信号控制作为一种有效的车流管理手段,其在现代交通管理中扮演着不可替代的角色,科学合理的交通信号控制方法不仅能够提高道路的利用率,同时也可以间接地降低尾气排放。本文以城市道路交叉口为研究对象,以车辆在交叉口区域的等待时间、停车次数以及主要污染物排放量作为评价指标,充分借助强化学习在最优控制领域中的应用优势,提出了一种综合考虑道路通行效率和车辆尾气排放的智能信号控制方法,本文主要完成了以下工作:(1)针对传统DQN算法的经验回放机制采用随机抽样方式忽略了不同样本对模型训练贡献度的问题,对DQN算法的经验回放机制进行改进,以样本的重要程度为依据,提出了采用分类经验回放机制的CER-DQN(Classifled Experience Replay-DQN)算法,实验结果表明:与传统的DQN算法相比,改进的算法可有效加快模型训练的收敛速度、提高模型的鲁棒性。(2)针对孤立的单交叉口场景,建立了基于强化学习的信号控制模型。首先,通过将交叉口进口车道分割成连续的等距网格构建模型所需的状态空间;同时,根据交叉口的几何特征和相位设计定义动作空间,并结合等待时间和停车次数构造综合奖励函数;最后,分别采用定时控制、DQN算法和CER-DQN算法在不同的交通流场景和奖励函数下进行实验。结果显示:从模型性能角度分析,不论是在中度交通流场景还是重度交通流场景下,CER-DQN算法相比DQN算法具有更快的收敛速度;从控制效果角度分析,两种交通流场景下,改进后的算法各个指标均呈现出更好的表现;此外,在奖励函数中引入停车次数对于降低车辆的CO2和NOx排放具有显著的效果。(3)针对相邻的多交叉口场景,在单交叉口模型的基础上建立信号控制模型。考虑到各交叉口之间处于相互竞争的状态,若对多个交叉口单独控制可能会导致整个路网的交通流分布不均甚至出现局部拥堵的现象。因此,在定义各交叉口控制模型时引入了相邻交叉口的排队和信号相位信息,从而实现各时空关联的交叉口之间的协作,仿真实验表明:相对独立控制,采用协作策略的多交叉口信号控制方式各交叉口之间的评价指标数值更加均衡,在一定程度上能够提升路网全局的通行效率。
其他文献
规划编制审批体系是国土空间规划“四梁”中的统领性要件,研究市级国土空间规划编制审批制度可以为市级以下规划的编制审批奠定坚实的工作基础。文章从编制体系、审批制度、事权关系等3个方面归纳市级国土空间规划编制审批制度实施的普遍困境;归纳分析行政层级事权导向型、重点单元管治导向型、功能分区传导导向型3种典型改革路径及其经验特点;以鄂州市为例,结合城市特征及现状问题,从市区协同、重点管控导向出发,提出“两层
期刊
早在3000多年前,人们就已经意识到了拖延现象的存在。迄今为止,虽然学术界已从心理学、社会学、经济学等诸多角度对拖延进行了大量研究,但对其外延的研究仍有所欠缺:大多数研究都集中于学业拖延上,有关工作拖延的研究相对不够丰富。事实上,与学业拖延一样,工作拖延在实践中也是司空见惯的现象,是组织进行人力资源管理时不可忽视的问题。因此,本文对工作拖延的研究,既可以填补一些研究空白,又可以对组织的管理实践有所
学位
两相闭式热虹吸管(又称重力热管)具有结构简单、换热效率高和无需外加能源驱动的优点,被广泛应用于各个领域。重力热管作为冷却地基的主要措施在寒区工程建设中受到越来越多的关注。为了更准确的探讨重力热管的传热性能,本研究设计并加工了一种含监测芯管的重力式氨-碳钢热管。通过在芯管内布设温度传感器的方式可以实时监测热管内工质的温度变化,为评价热管传热性能提供一种更直观的监测手段。本文结合芯管监测与管外壁监测两
学位
目的 观察人乳头瘤病毒(HPV)感染的宫颈上皮内瘤变(CIN)和宫颈癌患者血清转化生长因子-β1(TGF-β1)、HPV16VLPs-IgG1及HPV16VLPs-IgG2抗体水平,并分析其临床意义,为临床诊治提供参考。方法 选取金华广福肿瘤医院2017年9月—2020年10月收治的HPV所致的CIN和宫颈癌患者作为研究对象,同时选取同期在医院接受筛查的健康女性作为对照组。观察对照组、CIN组及宫
期刊
能源危机和环境污染是当前人类面临的两大难题,如何利用和开发可再生的新能源是解决当前问题的重要途径。自然环境中存在着大量废弃的能量,如热能,光能,液滴能,振动能,波浪能等,纳米发电机可以有效地收集这些清洁能源并转化为电能,是新能源领域的前沿研究课题。然而存在结构复杂,输出性能差,只能收集单一能量等不足。针对以上问题,本文以BNT-BZT和KNN-BNZ铁电材料为研究对象,设计了ITO/BNT-BZT
学位
<正>根据中国疾病预防控制中心性病艾滋病预防控制中心的数据统计,截至2020年底,中国现有105.3万报告的人类免疫缺陷病毒(HIV)感染者[1],在全球范围预计有3 690万人感染HIV。在中国,宫颈癌是女性第二常发肿瘤,仅次于乳腺癌,对此持续高危人乳头瘤病毒(HPV)感染与宫颈癌患病有密切的相关性[2]。HIV与HPV都是性传播疾病的病原体,二者之间有着复杂的相关性,为进一步探明二者之间的关系
期刊
半固态技术是利用金属材料位于固-液共存状态下所特有的流变性和触变性进行成形的技术,是一种新型的近净成形技术,具备高效、节能、近净成形生产以及成形件性能高等诸多优点。随着国内的汽车轻量化应用与研究的深入,变形铝合金的半固态成形技术受到越来越多研究者的重视。但是,目前国内对用半固态等温热处理制备变形铝合金的半固态坯料和触变成形对变形铝合金组织和性能的影响规律系统研究的很少。基于此,本论文以课题组自制的
学位
为解决重载铁路WJ-12型扣件弹性垫板压溃、疲劳后扣件静刚度变化率超限、混凝土轨枕承轨面磨损等问题,对现有热塑性聚酯弹性体(Thermoplastic Polyester Elastomer,TPEE)垫板进行结构优化设计。优化后,TPEE垫板的厚度和面内尺寸保持不变,单个凸台面积增大。采用有限元软件建立TPEE垫板静刚度计算模型和钢轨-TPEE垫板-轨枕耦合模型,对优化前后TPEE垫板的静刚度和
期刊
随着社会的不断发展,电能已成为人类生产生活的必需品。为了满足人们日益增长的用电需求,现代电力系统正在向特高压、大容量和远距离输电的方向发展,另外随着高比例可再生能源的接入,电网结构变得越来越复杂。对电力系统静态稳定性进行研究,通过连续潮流法提取静态电压稳定态势的数据,利用数据挖掘技术获取稳定—静态极限状态下系统的“源—网—荷”时空关联变换,获得电力系统静态电压稳定边界特征的判据,对于提高电力系统电
学位
随着我国工业技术的日益提高,各种高端制造业对现生产零部件的精度有了更高的要求,而数控机床是目前加工制造业的主力军,所以提升数控机床的加工精度已经是势在必行。造成机床加工精度低的重要因素之一就是机床自身存在和在加工过程中产生的误差。通过对误差的研究表明,当机床精度达到一定要求时,误差补偿法既可以有效地补偿误差,还可以节约大量成本。以GMC2000A机床为研究对象,分析了机床Y轴在不同温度分布下的轴向
学位