基于Q学习算法的两交叉口信号灯博弈协调控制

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:lz261433
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Q学习和博弈论相结合解决相邻两交叉口信号灯协调控制问题。在基本Q学习算法的基础上引入博弈论,以Q值作为赢得函数建立赢得矩阵。相邻两交叉口之间的协调关系属于二人非零和合作博弈,采用Nash公理方法求得其谈判解,并以此作为Q学习策略选择的依据实现两交叉口协调控制。应用Paramics交通仿真软件进行算法仿真,结果表明该方法的有效性。
其他文献
中国优秀传统文化积淀着中华民族最深沉的精神追求,代表着中华民族独特的精神标识,是中华民族生生不息、发展壮大的丰厚土壤。它具有鲜明的民族特色,历史悠久,内涵博大精深,
结合无源性控制和滑模控制两种非线性控制方法,并引入交流伺服系统,提出永磁同步电机(PMSM)的无源性滑模控制方法。文中分析了PMSM的无源性,并由此推导出矢量控制算法,采用滑模控制方法,设计了滑模速度控制器,从PMSM能量无源性的角度对控制器稳定性进行了证明,控制器参数由Lyapunov函数稳定性理论给出。针对滑模切换函数的高频"抖动"现象,采用模糊控制方法,设计了模糊切换函数,削弱了滑模切换函数
由中国企业文化研究会主办、广西投资集团协办的“深入推进企业文化创新,迎接第四次工业革命——中外企业文化2016南宁峰会”于2016年11月12日至14日在南宁举办。峰会围绕贯
某发电公司根据国家环保政策新变化,果断决策取消1号600 MW超临界机组烟气脱硫装置FGD系统烟气旁路,对FGD系统烟气旁路实施了封堵。从机务系统、电气和热控逻辑3方面做了修改
通过对"地县一体化"各种建设模式的研究,摸索出了一个适应淮北地区实际现状的建设方案,也就是"远程工作站"模式的一种衍生版本,详细阐述了"远程工作站"模式的"数据采集"方式,
电力变压器是电网最重要的高压电气设备之一,同时也是导致电力系统事故频繁发生的大型设备之一,其运行的可靠性直接关系到电力系统的安全与稳定。变压器故障统计分析表明,绝
拥有50年钢轨生产历史的包钢轨梁厂不断沉淀钢轨产品生产全过程的品质文化,把高质量、高标准、高素质的产品“DNA”复制到企业文化发展的全过程。2018年,厂党委紧紧围绕“高
在企业的一次高层管理干部培训班上,有一位学员分享了这样一个案例:2008年四川汶川大地震,这位川籍学员身在外地,家里的电话打不通,他焦急万分。这时,他接到了来自客户的询问
文件污染是当前P2P文件共享系统普遍存在的问题,极大的降低了系统的可用性。提出基于文件对象的污染传播模型,利用向量空间相似度赋予投票权重,使用horting图方法解决数据稀疏性问题,采用自适应的信誉阈值判断文件可信性,建立了基于对象信誉的P2P文件共享防污染系统。仿真实验表明,系统具有很高的识别精确度,能够很好的抑制污染文件在网络中的传播。
针对大型风电场接入模块化多电平换流器多端柔性直流输电系统的交流线路故障电气特性进行分析研究,提出对应不同故障电气特性的控制与保护策略,基于PSCAD仿真平台进行故障特