基于深度强化学习的无信号交叉口车辆协同控制算法

来源 :交通运输工程与信息学报 | 被引量 : 0次 | 上传用户:haifeng_liu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对未来智慧城市智能网联汽车通过无信号交叉口的通行效率问题,本文基于深度强化学习提出了一种渐进式价值期望估计的多智能体协同控制算法(Progressive Value-expectation Estimation Multi-agent Cooperative Control, PVE-MCC)。PVE-MCC算法设计了基于渐进式学习的价值期望估计策略,通过动态改变价值期望学习目标由短期到长期的变化,保证值函数网络渐进式地持续学习,避免策略网络陷入局部最优解,并将该策略与泛化优势估计算法结合,提升算法收敛精度和稳定性。其次,PVE-MCC算法以通行效率、安全性和舒适性为优化目标,设计了多目标奖励函数来提高多智能体协同控制的综合性能。此外,无信号交叉口易出现的“死锁”现象对多车协同控制带来了巨大的挑战,针对这一问题,PVE-MCC算法基于链表环形检测算法设计了启发式的“死锁”检测-破解干预策略,实现对“死锁”环的提前检测和破解,进一步保障交通通行的安全性。最后,本文搭建了双向六车道无信号交叉口场景的仿真实验平台,进行功能和性能验证。实验结果表明,PVE-MCC算法比现有方案提高交通流量30.47%,单车效率提升了95.56%,舒适性提升了53.82%。
其他文献
随着电子商务的不断发展,现代物流业已成为市场经济的强大支柱。但是,现代物流"速度与质量不均衡"等问题也暴露出来。现代物流愈加追求"经济发展速度"却忽略了消费者直观需求。为深入研究消费者对现代物流的需求现状,我们精心设计了100份调查问卷向消费者进行调查,基于五个不同地区消费者的不同需求,采用抽样调查的统计方法,运用office、Excel等办公软件及统计分析方法,更直观地对各项数据进行分析,以反映
近日,教育部在答复十三届全国人大四次会议第9636号建议"关于改善炒作学区房,保障教育资源共享"时表示,学区房的出现在一定程度上反映了优质教育资源配置不均衡、校际间办学质量存在差异的问题。下一步,教育部将研究制定《关于构建优质均衡的基本公共教育服务体系的意见》,缓解"择校热"和"学区房"等问题,切实促进教育公平、营造良好教育生态。(11月11日《中国教育报》)
期刊
学位
3月13日,"国美官方旗舰店入驻京东"的消息,炸翻了零售圈。多年的冤家,昔日的对手,你来我往间绞杀的炮火声犹在耳。如今,是什么力量让"兵戎相见"的两大巨头一笑泯恩仇?战起:激情叫阵江湖上,京东和国美的爱恨情仇由来已久。2012年8月13日晚上11点25分,京东CEO刘强东发微博:"今晚莫名兴奋"。网民的好奇心被拉到了最高点。第二天,谜底揭晓,大戏开场。刘强东连发9条微博,宣战国美,最显眼的一
期刊
分别从应用层、感知层和网络层阐述了低轨卫星物联网在智能交通运输中所利用到的关键技术,并给出了低轨卫星物联网的智能交通运输的系统架构。研究了低轨卫星物联网作为网络层所应用到的四种多址接入技术,并比较了传统ALOHA与CRDSA两种多址接入技术的性能差异。最后给出了低轨卫星物联网的性能仿真结果,分析了其在覆盖率上的性能优势,并利用CRDSA技术和调整地基转发数据配比对系统进行优化,提高了低轨卫星的接入
提出了一种基于深度确定性策略梯度(DDPG, deep deterministic policy gradient)的行人安全智能交通信号控制算法;通过对交叉口数据的实时观测,综合考虑行人安全与车辆通行效率,智能地调控交通信号周期时长,相位顺序以及相位持续时间,实现交叉路口安全高效的智能控制;同时,采用优先经验回放提高采样效率,加速了算法收敛;由于行人安全与车辆通行效率存在相互矛盾,研究中通过精确
随着信息技术进步以及政府企业和科研机构的持续大量投入,智能网联汽车技术得到了迅猛的发展。这项突破性的新技术将给微观交通建模研究带来怎样的机遇与挑战?围绕这个问题首先从建模机理及人因角度回顾了具有代表性的微观交通模型,并从统一形式、分类、完整度、应用场景等多个角度详细评述了微观交通模型进展。在此基础上,提出了耦合了“辅助系统-驾驶人-车辆-交通-驾驶场景”五元素的智能网联交通系统建模框架,认为采用符