论文部分内容阅读
随着交通拥堵、环境污染、交通事故等交通问题的日益突出,无人驾驶技术被认为是解决当前交通问题的有效方法。移动模型是无人驾驶技术的重要组成部分,是自主车进行决策与控制的依据。自主车的主要战术决策和行为是换道决策和跟驰,其中的换道决策是碰撞和拥堵的主要来源,是最具有挑战性的战术决策。然而,许多换道模型都是基于数学公式和交通流理论建立起来的,虽然在一定程度上能够模拟车辆的换道过程,为车辆提供换道决策,但缺乏车辆之间相互交互的考虑以及对其他影响因素的研究,使得其决策性能较低,不能够很好的作为自主车的换道决策。本文主要研究了网联环境下自主车的换道决策,主要贡献如下:(1)将车辆的换道场景看作是完全信息下的非合作博弈,通过分析换道场景下的博弈要素与行为,提出了联合驾驶风格和博弈理论的车辆换道决策,并且作为混合场景下自主车的换道决策进行仿真实验,最后在数据集上进行有效性验证。将风格系数引入到各方的博弈收益,体现不同风格对收益的重要影响,更加符合实际情况;使用恒定加速度和智能驾驶员模型的离散加速度两种方式来预测换道车辆的位置,更加接近实际情况。该决策模型能够进一步用于驾驶员辅助系统的开发和作为有人驾驶与无人驾驶混合环境下自主车的换道决策。(2)提出了一种基于函数逼近Q学习的自主车换道决策方法,为自主车提供换道决策。使用车头时距来降低状态空间的维度,有利于策略的探索与学习;通过合理的设置?-greedy策略的探索因子,从而加快算法的收敛速度;利用函数逼近的方法实现强化学习的泛化,更好的解决实际问题。最后进行了仿真实验,使用函数逼近Q学习的方法控制自主车的换道,并且与联合驾驶风格和博弈的换道决策以及其他方法进行比较,验证了方法的有效性。