基于深度强化学习的城市交叉路口智能车驾驶控制策略研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户：whywhywhy_why

【摘要】

：

【作者】

：

申明雨

【机构】

：

东北林业大学

【出处】

：

东北林业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着自动驾驶产业的飞速发展,智能车很快即将步入我们的生活。现有自动驾驶系统结构复杂,并且成本较高。交叉口作为重要的交通场景,对整个交通的效率、安全性和能耗起着至关重要的作用。通过国内外学者的研究,深度强化学习相关算法已经被应用于智能车驾驶控制策略的设计之中,主要应用场景为高速路、普通城区,并取得了可观的效果,针对于城市道路交叉口的研究仍然匮乏。因此,使用新兴算法如深度强化学习为自动驾驶设计安全可靠、并且成本较低的驾驶控制策略仍然具有现实意义。本文立足于低成本、高效率、高安全性等诸多要求设计了城市交叉路口智能车驾驶控制策略,并设计了多个驾驶任务进行了仿真验证。首先对深度强化学习理论进行了介绍与分析。介绍了基础强化学习理论,包括贝尔曼方程、马尔可夫决策过程等,引出了基于价值和基于策略的两种无模型强化学习方法,然后对两种方法相结合的演员评论家算法框架进行分析,为后续算法设计打下理论基础。在理论的基础上构建了自动驾驶深度强化学习模型,包括汽车运动学模型和本文所使用的深度强化学习算法之近端策略优化算法。为了能够有效结合人类的先验知识,本文采用Beta分布函数作为策略分布函数,并使用改进后的损失函数进行算法的训练,加速算法的收敛。在自动驾驶强化学习模型的基础上本文使用近端策略优化算法构建了端到端驾驶控制模型,提出通过由单摄像头传感器所采集的交叉口图像信息作为智能车状态空间输入,并且针对图像信息维度过大导致算法收敛速度慢的问题,提出使用变分自编码器进行图像特征的压缩,经仿真实验验证,所设计的变分自编码器能够有效提取图像特征,重构后的图像能够保留原始有效信息。设计了考虑多因素的奖励函数,通过仿真对比实验,本文所设计的奖励函数通过加入成功奖励,能够使智能车更快学习到合适的驾驶控制策略。此外,本文将基于深度强化学习的驾驶控制模型与规则判定机制相结合设计得到一种分层驾驶策略,其包括规则判定机制和基于深度强化学习的端到端驾驶控制模型和避撞驾驶控制模型,能够满足低成本、安全性、效率性的要求。最后比较了主流的自动驾驶仿真器,选择CARLA进行本文的自动驾驶仿真针对不同驾驶控制任务。对本文所提出的端到端驾驶控制模型、分层驾驶策略分别进行了仿真验证以及对比实验,结果证明经过训练得到的端到端驾驶控制模型能够仅通过单RGB摄像头传感器所采集的图像信息完成左转、直行、右转驾驶任务,极大的简化了传统的自动驾驶系统,缩减了成本。所提出的分层驾驶策略相较于传统基于规则的方法,保证相似的效率（即速度）的情况下,通过路口的成功率提升了34%。

其他文献

一种反应三元乙丙丁基自粘防水卷材及其制备方法

期刊

基于故事设计的老字号品牌形象更新——以江苏省丹阳酒厂为例

老字号品牌属于中华优秀传统文化的一部分,其品牌核心价值来源于品牌发展的历史积淀和其掌握的核心技艺。江苏省丹阳酒厂拥有江苏老字号,国家级非物质文化遗产——封缸酒传统酿造技艺等优秀的品牌特质。但固守在品牌原先的技艺和产品体系中,已经不能适应现今的消费市场,造成品牌老化,同时由于缺乏独特的品牌记忆点,导致消费者对其品牌缺乏清晰的认知。品牌的故事设计为老字号品牌形象更新发展带来了新的机遇,故事成为老字号与

学位

战汉时期漆奁纹饰及其衍生设计研究

战汉时期漆奁纹饰艺术特征鲜明,构图形式多样,纹饰元素丰富,色彩表现经典,不仅体现战汉时期的风俗文化,也呈现出不同时期的审美特点,具有非常重要的历史文化价值与艺术美学价值。然而,在互联网飞速发展的现代社会,战汉时期漆奁纹饰的发展受制于传统器物的表现形式,已无法满足消费者与市场的需求。但其蕴含的价值仍值得深入挖掘与延续,使其发挥文化与审美作用,唤醒现代人对传统文化的记忆,融入中国人的精神血液,使之成为

学位

基于热舒适评价的历史街巷更新设计研究——以镇江市大龙王巷为例

历史街巷是城市空间的重要组成单元,合理保护和更新历史街巷,能传承地域文化,延续城市历史和记忆。然而,许多历史街巷因更新滞后,导致街巷面貌老旧、空间狭窄、热环境不断恶化,严重影响街巷的历史风貌和空间格局。通常此类街巷是老龄化程度较高的地区,恶化的热环境不仅影响老年人对户外空间的使用率,也影响他们的身心健康。因此,本文以镇江大龙王巷历史街区为例,基于数值模拟软件模拟街巷内微气候,利用人体热舒适值对街巷

学位

考虑绿灯延长的干路公交优先信号协调控制模型研究

随着我国经济和人口的不断增长,我国的机动车的保有量也在迅速增加,城市面临的交通拥堵问题正日趋严重。为缓解城市的交通拥堵问题,现有学者分别从信号配时、干线信号协调控制方法、公交优先等方面做出大量研究和努力,也通过将公交优先理念融合到不同领域来缓解上述问题并取得了较为丰硕的成果。然而,现有研究提及的干线信号协调控制方法与主动公交优先控制策略相结合的研究较少,并未充分将公交优先理念与干线信号协调控制方法

学位

基于深度学习的乘用车制动距离预测方法研究

从汽车诞生之初,其制动性问题就随之而来,有关制动性的研究也一直持续到现在。无论是传统燃油汽车、混动汽车还是蓬勃发展的纯电动汽车,以及近几年受市场追捧的智能车,均面临着一个相同的问题,如何确保汽车的制动性处于良好状态,使驾驶人能够安全可靠的使用车辆。目前,汽车制动性检测主要依靠相关机构定期对车辆进行年检或审查,此方法已逐渐不能满足驾驶人的需求,如何利用行车制动数据对整车制动性进行追踪和判断成为目前研

学位

木陶瓷制动衬片的制备及试验研究

汽车制动衬片作为决定制动器制动性能的关键零部件,液压制动系统将制动衬片与制动盘或制动鼓压紧在一起,通过摩擦副之间的摩擦阻力做功,将行驶中车辆的动能转化为摩擦副摩擦产生的热能与外界环境进行热交换实现车辆的制动过程。汽车制动衬片需要具备优良的摩擦磨损性能来提供足够的摩擦阻力,良好的散热特性及耐高温特性以确保摩擦材料不会热解及缓解制动盘“热衰退”现象以提高制动器制动效能的稳定性。同时作为汽车的消耗性零部

学位

一种双胎基沥青防水卷材

期刊

可变道路单元划分及交通拥堵特性分析方法研究

城市常发性交通拥堵受居民出行习惯与城市路网布局的影响,在发生与演变等方面具有相应的时空特性。为解析城市交通拥堵在时空上的特性,探明交通拥堵发生位置、持续时间、演变过程等规律,本文以出租车GPS数据为基础,优化传统道路划分方法,提出可变道路单元概念,并基于可变道路单元改进交通拥堵时空特性分析方法,从多角度对交通拥堵时空特性进行解析。针对案例区域进行实际分析,明确了交通拥堵在不同时间与空间上的分布情况

学位

一种双胎基预铺增强型防水卷材及其施工方法

期刊

基于深度强化学习的城市交叉路口智能车驾驶控制策略研究

与本文相关的学术论文