基于深度强化学习的商用车编队控制方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:cheerlucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国社会经济的不断发展,汽车保有量不断增加,随之带来的燃油消耗、道路拥堵和交通安全等问题也日趋严重。商用车作为目前货物运输的主要途径,截至2021年1月我国商用车货运规模占总货运规模的74.4%,同时载货商用车燃油消耗占总燃油消耗量比例超过50%,且仍有上升趋势。因此如何提高商用车的行驶安全性及燃油经济性具有重要意义。随着通信技术、控制方法和传感等技术的不断发展,先进的商用车编队控制方法被证明对提高车辆行驶安全性、提高燃油经济性和降低排放具有重大的社会经济效益。目前在车队控制器的研究中,考虑通信延迟、拓扑结构和串稳定性的条件下,大多数车队控制都是基于MPC和PID等控制方法进行控制。随着深度强化学习的发展,智能体能根据复杂周围环境状态决策出控制量,对于车队系统的控制有很大的益处。同时,在设计商用车队列控制器时,大多数研究人员将车辆视为质点,使用简单的线性运动学模型或3自由度车辆模型为基础模型,对车辆进行建模研究,无法准确地表达车辆系统自身的动力学特性及车队行驶过程中的横纵耦合作用。因此,针对上述问题提出使用强化学习对车队进行编队控制,将车队跟随车看成一个智能体进行训练,将车队内的信息交互看作具有马尔科夫性质的决策过程,使用神经网络作为函数近似器将状态空间映射到动作空间中。并在训练过程中使用六自由度动力学模型对车队单车进行动力学建模,使得车队单车的动力学特性更加真实。本文的主要工作内容如下:(1)基于Matlab/Sumo的强化学习框架搭建针对强化学习训练环境建模问题,本文选用Sumo作为交通仿真软件,使用Traci4Matlab接口实现了Sumo与Matlab的信息交互,搭建了联合仿真平台。同时,在Simulink环境中使用系统方程将Sumo封装成Simulink功能模块,实现了基于Sumo的强化学习实时训练。最后在Matlab中搭建了包含车队智能体、智能体训练环境、车辆动力学模型和神经网络的强化学习训练框架。(2)商用车队列模型搭建针对商用车建模问题,本文使用研究室已有的六自由度动力学模型来对商用车进行建模研究,使用Truck Sim验证了模型在商用车参数下的有效性,分析了固定求解步长下不同求解方法的求解精度。对五台车组成的同质车队进行研究,确定了采用可变车间距策略和车队内的通信拓扑结构。(3)强化学习车队智能体搭建及训练通过八组试验对比了不同神经网络结构对车队智能体训练效果的影响,确定了多神经元、少隐藏层的神经网络结构对车队智能体进行训练,并根据大量探索确定了神经网络的训练参数。在连续空间中对车队状态空间和动作空间进行设计,同时根据车队性能要求设计奖惩函数。最后在搭建好的强化学习框架中进行训练,通过不断验证智能体是否具有有效性,确定最终车队跟随车智能体策略。(4)深度强化学习控制方法有效性验证本文在固定道路曲率的环形道路上对训练好的跟随车智能体进行仿真验证,设置领航车分别以匀速和变速工况进行行驶,观察跟随车在不同速度工况下能否很好地跟随领航车,并实现串稳定性。
其他文献
作为一种新型电极材料,MXenes在超级电容器中表现出优异的性能。与此同时,具有更宽电化学窗口的离子液体电解质有望大幅增加超级电容器的容量。MXenes与离子液体组合有望构建具有高能量密度和高功率密度的储能器件和设备。研究表明,MXenes电极的表面终端以及离子液体电解质的官能团都对超级电容器的性能都有较大的影响。然而,在分子水平上的机理解释和研究仍然缺乏,这为新型电容器的开发设计提出挑战。本论文
学位
“互联网+”技术在出租车行业的成功运用,直接推动了网约模式的兴起,提高出租运营系统整体供需匹配准确度,网约车服务逐渐成为城市基础设施中不可缺少的一环。但网约车企业崛起的速度过快,企业之间没有达成统一的行业共识,竞争激烈,对原有市场生态造成剧烈冲击,产生了诸多社会问题。本文针对包括巡游出租车、网络预约出租车以及可以提供网约服务的巡游出租车(简称“巡游+网约”模式出租车)在内的多种运营模式的市场环境,
学位
快速路交织区是城市交通的重要组成部分,车辆的频繁换道行为使得交织区瓶颈问题更加严重,大幅降低了快速路整体的通行效率。对于交织区而言,基于换道需求的协同控制策略就显得尤为重要。首先,对交织区交通特性进行分析。论文从交通组成、道路条件以及交织区长度对交织区通行能力影响因素进行分析,明确后续仿真场景搭建过程中需要着重考虑的参数设置。通过对交织区瓶颈现象进行解释说明,明确提高交织区通行能力的关键在于将交通
学位
当代经济的快速发展以及可再生和可持续能源的需求日益增加,推动着电化学储能技术的蓬勃发展。具有高能量密度和循环寿命长等特点的锂离子电池(LIBs)在电化学储能技术中占据着主导地位。然而,锂离子电池逐渐达到其放电容量的上限,锂资源有限且分布不均,生产成本高。因此,急需开发出新型低成本、高性能、无污染的储能技术。与锂相比,钠资源丰富,分布广泛,并且钠基双离子电池(Na-DIBs)可采用石墨类材料充当正极
学位
工业废水污染物的去除是环境治理中极具挑战的内容,具有重要现实意义,也是目前学界的研究重点。成型碳材料(碳海绵、石墨烯气凝胶、介孔碳等)作为一类具备工业应用前景的材料,以高疏水性、高比表面积、高孔隙率及良好的化学稳定性,在吸附领域具有广阔的应用基础。电吸附技术因其强大、节能、低成本的特点越来越受到人们的青睐,被用于增强吸附剂对废水污染物吸附治理效率。本文以成型介孔碳材料(MMC)作为吸附剂,在电场作
学位
随着我国道路交通事业的快速发展,汽车保有量逐步增加的同时,交通事故数量也居高不下。在人—车—路闭环系统中,驾驶人担负着环境感知、决策以及车辆操纵等复杂任务,驾驶人因素是引起事故的主要因素,驾驶人的感知错误、决策失误或操作不当极易引起交通事故的发生。因此,对交通环境的充分观察和感知是决策发生和正确操纵的前提,也是可避免事故发生的重要方式。驾驶人通过视觉感知可获取80~90%的外界信息,准确的视觉感知
学位
道路交通系统随着5G技术和智能汽车技术的不断发展呈现智能化、网联化和协同化的发展趋势,海量交通信息的获取与共享使智能驾驶逐渐成为可能。在实现全部网联车辆自动驾驶之前,可以预见在未来一段时期内势必存在人工驾驶车辆、非网联自动驾驶车辆、网联人工驾驶车辆和网联自动驾驶车辆组成的智能网联混行驾驶环境。智能网联混行驾驶环境下,“人-车-路-环境”道路交通信息量呈现爆炸式增长,由于驾驶人的认知能力所限,不能在
学位
随着电子信息技术的飞速发展,电子设备运行速度越来越快。运行速度的增加会导致热量的累积,反过来会对设备的性能造成影响。因此,对器件内部的散热提出了更高的要求。鉴此,本文选用端乙烯基聚二甲基硅氧烷为基体,鳞片石墨和微米银为导热填料,制备了一系列导热垫片,得到了综合性能优异的热界面材料,并探究了不同因素对导热垫片导热性能的影响。主要研究内容包括:(1)以天然鳞片石墨作为导热填料,硅烷偶联剂作为改性剂,端
学位
随着汽车行业的技术变革与革新,智能化的自动驾驶和网联化的驾驶环境成为了汽车与交通行业发展的风向标。学术界和企业技术领域均认为自动驾驶和智能网联的技术融合成果-智能网联自动驾驶汽车(也称智能网联汽车)与智慧交通系统相结合的大趋势,可以较大程度减缓严重困扰人类的道路交通安全问题。其中,由于现有交通事故中由超车引发的事故比率较高,相关科学研究主要关注准备超车或正在进行超车驾驶行为或并道行为的车辆,很少有
学位
驾驶疲劳是造成道路交通事故的主要原因之一,与其他交通事故致因相比,驾驶疲劳更容易导致死亡或重伤,其具有个体表征多样化和疲劳特征隐匿性强的特点,研究驾驶人在途疲劳状态辨识对改善道路交通安全具有重大意义。由于不同驾驶人间存在个体差异性,导致驾驶疲劳共性特征不明确,现有疲劳辨识算法无法满足疲劳辨识的高前瞻性要求,如何正确处理驾驶人疲劳特征的个体差异,已成为目前驾驶疲劳研究中的关键问题。因此,本文立足于该
学位