论文部分内容阅读
随着智能交通系统的发展,具有高度自动化水平的智能驾驶系统引起了公众和研究机构的持续关注,并取得长足的发展与进步。然而,在需要考虑乘客舒适性、驾驶平顺性等多种因素的复杂工况下,传统智能驾驶系统的运动规划模块自适应性较差,很难满足自动驾驶的实时性需求,从而降低行车效率,影响驾驶安全,但有经验的驾驶员可以凭借经验和直觉适应不同的驾驶环境,完成复杂工况下的驾驶任务,而不需要预先进行复杂的车辆动力学和运动规划计算。本课题基于传统智能驾驶系统现有框架,对其进行调整改进,将驾驶员的行为和经验纳入智能驾驶系统中,针对纵向速度的规划和控制问题,提出了一个可以在线学习人类驾驶员驾驶行为并实现类人驾驶的新型学习系统。该类人驾驶学习系统包含了两个主要模块:人类驾驶策略学习模块和纵向速度控制模块。针对纵向速度规划控制问题,人类驾驶策略学习模块通过在线学习人类驾驶员的行车数据,生成符合该驾驶员行为的纵向期望速度;纵向速度控制模块通过PID控制器将学习到的纵向期望速度转换为油门和制动踏板控制量完成车辆的运动控制。针对具有连续状态和动作空间的纵向速度规划控制问题,本课题采用连续空间强化学习方法Neural Q Learning(NQL)来实现人类驾驶策略的学习。NQL结合了人工神经网络和Q Learning算法,能够对价值函数进行泛化和逼近,从而克服了传统离散强化学习的“维度灾难”问题,因此更适用于连续的状态和动作空间。本课题利用Prescan与Matlab/Simulink软件搭建了联合仿真平台,并结合仿真和实车试验平台,针对不同的驾驶场景对所开发的学习系统进行了测试和对比试验。试验结果如下:(1)通过定距离跟驰仿真试验,表明了NQL方法可用于纵向速度规划控制问题;(2)通过在多种场景下的仿真试验,表明该学习系统可以在一定误差范围内完成在线类人驾驶,但随着场景复杂度增加该系统的学习能力有所下降。当学习优秀驾驶员数据时,该学习系统的乘车舒适性与行驶平顺性优于传统自适应巡航(Adaptive cruise control,ACC)系统,为个性化辅助驾驶提供了研究思路;(3)通过实车试验进一步验证了该学习系统的可行性,但实车数据较仿真数据更为复杂多变,学习系统的学习性能有所下降。