城市交通信号的在线强化学习控制

来源 :第26届中国控制会议 | 被引量 : 0次 | 上传用户:fan8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市交通信号控制系统具有非线性、模糊性、自组织性和不确定性等特征,传统的建模和控制方法难以取得理想的效果,人工智能方法提供了解决问题的新途径.针对交通信号控制系统的特点。提出了基于Dyna-Q强化学习的在线控制算法,利用交通信号控制Agent在试错过程中获得的经验知识进行模型估计,然后从估计的模型中规划动作,从而可以加速Q-学习迭代过程.采用TSIS交通分析软件对由8个路口组成的两条交通干线进行仿真,与定时控制、遗传算法和Q-学习控制方法进行比较,结果表明:Dyna-Q强化学习算法具有明显的优越性。
其他文献
目的:鉴定益气养阴解毒抗突变复方的抗突变功效,回顾性分析该方同步配合表皮生长因子受体酪氨酸激酶抑制剂吉非替尼治疗表皮生长因子受体(epidermal growth factor receptor,
书法教育作为传统教学的一个重要组成部分,各个学校对其重要性的认知度不断提高。但是现今的书法教育还处在一个起步的初级阶段,存在和急需解决的问题很多。如何认识这些问题
语块学习是二语习得的重要内容之一。通过对美国语言学家斯蒂芬·克拉申(Stephen D.Krashen)'输入假说'理论的学习研究,把语块作为翻译过程中的基本单位,深入探
罪刑法定是国内刑法上的古老而文明的基本原则,然而,在国际刑法上,它的处境却是极其尴尬的:在国际刑法短暂的历史上,绝大多数时候,罪刑法定不为国际刑法所认可。近来,肯定罪
为进一步拓展天然高分子絮凝剂壳聚糖的应用范围,以壳聚糖、L-半胱氨酸为原料,通过酰胺化反应制备一种具有重金属捕集功能的高分子重金属絮凝剂-2-氨基-3-巯基丙酰壳聚糖(MCC
从受钻井废水污染的土壤样品中筛选菌株进行生物处理实验,确定7株菌进行菌剂配伍。通过正交实验剔除可能有抑制作用的菌株,并确定菌剂各组成菌株的最佳配比,制成复合微生物菌
目的:研究鸦胆子油乳联合化疗治疗晚期非小细胞肺癌的临床效果。方法:将107例晚期非小细胞肺癌患者随机均分为治疗组与对照组。两组患者均采用GP化疗方案,28 d为1个周期,共化
采用文献资料、逻辑分析等方法,对高校公共体育课程教学现状进行归纳、总结、分析。并提出相应对策:从思想入手,让大学生自觉牢固确立终生体育的意识;树立学生榜样,发挥群星力量;教
全球结核病疫情严峻,2017年全球约1000万人感染结核病,死亡160万病例(包括30万HIV阳性结核病患者),加上世界各地耐多药结核菌和广谱耐药结核菌的剧增,导致目前结核病防治面临极大挑战,开发新型抗结核药物及新的辅助治疗迫在眉睫。民族医药是人类长期实践积累的资源宝库,是各民族长期运用传统药物与疾病奋斗的经验总和,为现代医药的研究提供了重要的资源和线索。长期被运用于结核病治疗的传统药物具有潜在的
简要介绍了热喷涂技术的基本概念和应用领域,重点研究了热喷涂技术在耐磨涂层、热障涂层、耐腐蚀涂层和高温抗氧化涂层中的应用,并简单介绍了上述功能涂层的应用原理,针对热喷涂