基于Q学习的交通信号自学习控制方法的研究

来源 :工业仪表与自动化装置 | 被引量 : 0次 | 上传用户:ustcer08005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了减少车辆通过交叉口的平均延误时间,将Q学习与模糊推理相结合对基于智能体的单交叉口进行信号配时优化,以适应动态变化的交通流。在模糊控制规则集的基础上,通过遗传算法优化模糊推理中的隶属度函数参数,克服传统隶属度函数设计的主观性和盲目性。在此基础上,通过Q学习算法对其在线学习,以实现单交叉口交通信号控制智能体的自学习能力。仿真表明,该方法相比于传统的定时控制与模糊控制,具有较好的控制效果。
其他文献
贫困问题存在于世界各个国家,但是中国大陆地区的贫困问题有其显著特点。这些特点有些是所有国家或地区发展过程中都会出现的,有些是我国政府的政治经济政策等问题造成的。贫
简述了均匀送风管道各种形式及工程实现方案 ,并在理想假设的基础上对理论公式进行简化 ,提出了相关简化公式 ,并通过实例对公式进行了验证。
<正>广告大师大卫.奥格威曾说"广告就是为了销售,并无其他"。奥格威的这句话可以做三方面解读,一是它很明确指出了广告存在的根本性价值。无论从广告的起源——出于销售目的
<正> 皇泽寺石窟坐落在四川省广元市西1公里的嘉陵江上游西岸,与东岸的千佛崖隔江遥遥相望,为第一批全国重点文物保护单位。50年代及60年代初,发表过关于皇泽寺石窟的简介。
农民人情消费是农民理性选择的结果,但是一些理性选择行为正在为一些非理性选择行为所代替。农民人情消费对农民社会发展既具有一定的积极作用,也会带来一些负面影响。对此,
调节阀是自动化工业中非常重要的、必不可少的终端调控元件,阀门定位器是调节阀主要的配套元件,它与执行器配合使用,从而保证调节阀位置依照控制器给定信号正确输出。本文首
地方政府债务主要来源于银行等金融机构,任其风险在金融系统中隐性蔓延和扩张,势必酿成我国系统性金融风险。本文首先构建一个地方政府债务风险向金融系统外溢的空间路径和依
目的比较鱼油脂肪乳剂和中长链脂肪乳剂对肠衰竭相关肝损害患儿肝功能的影响。方法回顾性分析上海交通大学医学院附属新华医院1999年1月至2017年5月65例接受肠外营养肠衰竭患
现代教学论意义上的"语文朗读法"是"语音呈现"和"信息加工"内外协同进行的学习方法。如何在外部"语音呈现"的同时,开启内部的"信息加工",是语文朗读法的"技术"所在。只有外部
在不同严重程度的道路交通事故中,重大伤亡事故的发生概率虽低,但其造成的社会影响和财产损失却是其它事故类别的几倍甚至几十倍。重大伤亡事故发生中,车辆和驾乘人员会在所处的物理空间发生一系列如车辆翻滚、人员弹射等行为,本文中将这些行为统称为人车物理行为。目前,国内关于重大伤亡事故中人车物理行为的研究较少,且多数研究都是基于仿真实验来开展,与实际情形存在一定的差异。国外虽从实际事故数据出发,利用各类统计模