单交叉口多相位在线Q学习交通控制模型

来源 :交通科学与工程 | 被引量 : 0次 | 上传用户:passiionlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了优化交叉口信号配时,通过集成Excel VBA-Vissim-Matlab的仿真平台,建立了以总关键排队长度之差最小为优化目标的单交叉口在线Q学习模型,包括定周期和不定周期两种模式的Q学习配时模型.针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均总关键排队长度之差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.通过算例,将定周期Q学习配时方案、不定周期Q学习配时方案与Transyt配时方案进行对比.研究结果表明:以总关键排队长度之差作为优化目标能
其他文献
研究了如下非线性微分方程x^1=A(f)x+f(t,x),利用指数型二分性理论和李雅普诺夫第二方法,得到了上述扰动系统在一定的条件下能和其线性系统保持同步的稳定性,推广了现有的相关理论。
1 合理密植确保通风透光良好.西瓜密度667m2早熟品种800~1 000株,中晚熟品种500~800株,嫁接苗200~500株,无籽西瓜约500株.间作套种要加大行距,保护地栽培不能过密,以不互相遮光,
利用Hilbert空间中正交投影的有关理论,给出并证明了最佳线性预测在内积定义下的一个定理,以此作为适时递归预测的基础。讨论了新息递归算法的理论和方法,将新息算法运用于多维M
环境与市政工程实验中心前身为苏州城建环保学院环保系实验室,始建于1984年。为了适应专业调整和管理需要,经过不断的整合建设,逐步形成了以环境污染控制、流动与传质及城市给水
基于Hamilton能量变分原理和薄板的基本假设,考虑地基阻尼的影响,建立了双参数粘弹性地基上考虑耦合效应的四边自由矩形薄板的非线性自由振动方程以及板域外的控制方程.应用
对斜拉索在轴向基础激励条件下的振动进行了理论分析,并建立了拉索面内运动模型。基于哈密顿变分原理,求得了拉索的非线性运动方程。利用Galerkin法,将方程解耦。并运用多尺