基于端到端学习的自动驾驶决策算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xixihahawotiana
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车保有量的增加,自动驾驶技术在解决道路安全等问题中起到了关键性的作用。针对自动驾驶中导航定位、路径规划、行为决策和车辆控制等关键技术,本文对自动驾驶中的决策部分展开研究。随着人工智能算法的迅速发展,通过深度学习算法、深度强化学习算法实现的自动驾驶端到端决策,成功简化了传统自动驾驶系统结构。本文将在真实驾驶数据集与虚拟驾驶环境中对基于端到端学习的自动驾驶决策算法进行实践、改进及验证。首先,现有端到端驾驶决策算法大多采用图像序列作为输入,通过神经网络模型直接预测车辆方向盘转角,但这种方法并不能完成车辆自动驾驶任务。因此,本文提出了一种基于深度学习的端到端驾驶决策模型,其对深度卷积神经网络提取的视觉特征进行加权处理,并建立了一个端到端的系统来学习自动驾驶过程中的拟人决策。此系统由VGG16网络、循环神经网络和全连接网络组成的,系统的输入为在时间上连续的无人车第一视角图像序列与车速序列,系统的输出为两个浮点数,分别代表要预测的车辆方向盘转角及车速。为提高预测精度在基于深度学习的端到端驾驶决策模型中增加注意力机制,并在Comma.ai驾驶数据集中验证了该模型的有效性。在纵向车速预测环节上,基于注意力机制的端到端驾驶决策模型相比纵向车速预测模型平均绝对误差减少了71.9%,此外基于注意力机制的端到端驾驶决策模型相比无注意力机制的模型平均绝对误差减少了7.93%。其次,设计了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的驾驶决策控制器,通过增加控制障碍函数(Control Barrier Function,CBF)对DRL控制器输出的车辆动作进行限制,提高了车辆行驶安全性。采用深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)作为端到端驾驶决策控制器,将无人车第一视角的图像序列与激光雷达点云投影的2D图像序列作为输入,控制器的输出为车辆的油门制动踏板开合程度和方向盘转角。若车辆横向控制动作无法保证车辆行驶在安全区域中,则通过二次规划求解满足安全行驶条件的车辆横向控制命令。实验过程中设计了基于仿真环境信息和相关交通规则的奖励函数,在CARLA驾驶仿真环境中完成测试,经过相同训练周期后本文提出的基于端到端学习的DRL-CBF控制器可以完成车辆行驶任务并保证基本行驶安全,DRL-CBF控制器的平均步长远超基于DDPG、SAC、DQN算法的端到端驾驶决策控制器。在相同测试场景中基于DDPG-CBF控制器的车辆横向控制的波动时间小于SAC-CBF控制器,同时DDPG-CBF控制器控制的车辆车速更高且稳定。
其他文献
为克服国际金融危机对我国经济的后续不利影响,确保我国经济的持续健康发展,国家将继续实施适度宽松的货币政策,强化金融部门加大对实体经济的信贷支持,特别是强化金融对"三农"的信贷支持力度。那么,在后金融危机时代,
期刊
为了提升能源利用率,促进可持续发展,为解决全球性环境问题做出贡献,航运业应重视船舶的节能减排问题。本文围绕船舶主机降功率节能减排的技术要点与优化措施进行分析探讨,为从业者提供参考。
距圣巴西勒教堂、红场与克里姆林宫仅几步之遥,扎里亚季耶公园所处位置历史悠久,在这里可以饱览俄罗斯的所有历史和其不断发展的愿景。此处占地35英亩,无数次见证着历史的沧桑变迁。19世纪,这里曾是犹太人飞地。后来,一座斯大林主义摩天大楼在此处破土动工,尽管最终未曾建成。欧洲最大的酒店——罗西娅酒店——也一直屹立于此,直到2007年才被拆除。之后五年里,由于设计师诺曼·福斯特一直在负责筹划将其扩建为
期刊
近年来人们节能环保意识的不断提升,对于环境问题的关注度也越来越高,我国也提出了可持续发展战略,希望社会各界在发展过程中都能够加大环境保护的关注度,切实提高各种资源的利用率,尽量减少对生态环境产生的破坏,促使我国真正走向可持续发展的道路。基于此,在本文中首先简单介绍了节能减排和环境保护的意义,结合目前环境保护现状,探讨了几点有效的解决对策,希望能够促进我国未来经济水平的稳步增长,真正实现人与自然的和
能源是人类生存﹑社会进步和经济发展不可缺少的物质基础。能源问题一直是经济发展中的焦点与热点问题,正确认识与处理能源在消耗过程中存在的问题﹐对于我国今后经济和社会的长远健康发展均具有十分重要的意义。目前来看,我国能源应用过程中还存在很多问题,如能源总量比较大,但人均消费的能源却少之又少,甚至还存在高能耗的情况,对于企业及国家发展均有不利影响。在新的时代背景下,我们要转变以往的发展理念,探讨能源现状,
自20世纪五、六十年代,A. P. Calderon和A. Zygmund建立奇异积分理论以来,以Calderon-Zygmund奇异积分算子为核心的各类算子(如振荡乘子算子,多线性积分算子等)成为近代调和分析理论研究中最为活跃的课题之一,由此形成并发展起来的许多方法和技巧已被广泛应用于算子有界性的研究当中。它们在复分析、位势论、算子理论、非线性分析等众多数学分支中都有广泛应用,相关文章参看[2、
针对高速公路场景中无人驾驶车的换道决策问题,提出一种基于竞争结构的双深度Q网络(DDQN)的无人车换道决策模型.在深度Q网络的基础上,将无人车动作的选择和评估分别用不同的神经网络来实现,并将Q网络分为仅与状态S相关的价值函数和同时与状态S和动作A相关的优势函数两部分,使得Dueling DDQN模型可以更好地理解外部的状态环境.使用训练模型在不同复杂程度的道路环境中进行测试,同时与DQN和DDQN
地面无人车的集群作战运用是当前人工智能与作战指挥交叉领域的热点研究问题。针对实际环境中多无人车无法满足动态威胁条件下的协同路径规划问题,采用全局路径规划算法A-star与局部路径规划算法RL相结合的思路,从感知到行为决策全交互协同的角度开展多无人车协同路径规划模型研究,设计协同作战态势威胁算法,状态与动作空间,奖励函数,势力范围函数,在此基础上设计协同作战编队构型策略生成及打击路径动态优化子模型,
无人驾驶的全面实现是一个循序渐进的过程,其间不可避免地会出现多形态的交通主体混行的情况。本文考虑了无信号路口处无人驾驶车辆与行人混行下的过街行为,引入了行人过路信任、无人驾驶车冲突损失溢出和行人过路信号交流等概念。从演化博弈的视角构建了双方冲突博弈矩阵,建立了双方交互演化的动力学模型,并分析得到了双方过街行为的演化稳定策略。结果表明:行人和无人驾驶车的策略选择与行人对无人驾驶技术的信任程度和无人驾
突如其来的新冠肺炎疫情使得体育馆成了应对公共突发卫生事件、进行方舱医院适应性改造的后备力量。本文分析了多个已被改造为方舱医院的体育馆室内围合形态,以哈尔滨某体育馆比赛场地区域作为研究对象,在原有体育馆室内形态的基础上进行CFD风场模拟,根据武汉既有体育馆室内风环境改造原理提出两种改造方法,通过风场模拟,得出室内水平及垂直风场的分布结果,并与方舱医院病房区风环境要求做对比,分析得出既有体育馆改造为方