虚拟环境下的汽车自主驾驶策略的研究与实现

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:wychenjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G时代的来临和人工智能研究的发展,自动驾驶成为当下学术界、工业界和商业界备受关注的焦点。传统的驾驶策略模型,是通过人工来进行数学建模,对于复杂的交通环境,不能很好的处理,无法满足自适应的驾驶策略的需要,而让汽车具备自主学习能力是研究的重中之重。自动驾驶汽车基于特定试验场所和特定路段测试进行自适应训练不现实,耗资巨大且测试效率不高。为了解决传统驾驶策略高度依赖模型和当前实地测试的局限性和问题,构建一个安全且高效,学习和测试一体的自动驾驶汽车测试平台是必不可少的。针对上述问题,本论文所作的工作:第一,基于TORCS,搭建了虚拟环境下的汽车自主驾驶的仿真系统。对TORCS软件进行适当的改进,在ubuntu16.04系统平台中,基于Gym环境,使用python语言对TORCS封装。实现了在前端的虚拟汽车智能地行驶于TORCS虚拟环境中。第二,使用深度强化学习算法学习来代替传统驾驶策略模型方法,从而能够学习到自主驾驶策略。本论文使用双智能体的DDPG的驾驶策略的算法,不需要车辆动力学模型,只需通过与环境交互进行学习,在复杂环境中更具鲁棒性。在仿真系统中,对比深度Q-学习,显示了本文所用的方法的高效性和可行性。第三,使用MADDPG架构来实现多虚拟汽车合作驾驶。将基于双智能体的DDPG的自主避障驾驶策略扩展应用到多虚拟汽车中,在构建的虚拟环境中,实现了三车合作驾驶。通过将多个智能体集中学习训练,分散执行,加快训练的时间。对比传统的DDPG,本论文所用的MADDPG学习的更加稳定,学习时间更短,显示了较强的泛化能力。通过研发,构建了虚拟环境下的汽车自主驾驶的学习系统,能够对实际路况较为逼真模拟,实现了虚拟环境中的汽车自主驾驶策略的学习的效果。本论文使用深度强化学习算法学习到的驾驶策略,在虚拟环境取得了较理想的效果,能够实现自适应学习,通过虚拟汽车自主决策行为来表达真实自动驾驶汽车的智能性,辅助现实环境中自动驾驶汽车训练过程。
其他文献
基于广大市民日益增长的健身需求,体育场馆、全民健身中心、体育公园、健身步道等各类公共体育设施正在全国范围内快速建设并发展着。然而,对众多脱胎于竞技体育设施的公益性
随着中国的经济增长和城市化进程的不断发展,如何发展公共交通成为了一个重中之重的问题,而在“可持续交通”的口号号召下,城市公共自行车的发展也扮演着越来越重要的角色。
细胞周期(cell cycle)是指细胞从一次分裂完成开始到下一次分裂结束所经历的全过程,分为间期与分裂期两个阶段。其中,间期分为三期、即DNA合成前期(G1期)、DNA合成期(S期)与D
社会媒体平台的繁荣发展导致大规模嘈杂的短文本产生。短文本主题挖掘旨在从海量的社会媒体短文本中挖掘潜在的主题信息,可用于文本摘要、话题推荐和回复生成等应用。目前,面
室内湿度影响着日常生活、生产的各个方面,如博物馆、画廊等场所以及纺织、造纸等生产工艺都对空气的湿度有着很高的要求。在建筑围护结构内表面应用调湿材料是一种调控室内
移动互联网的迅速发展,使得运行于智能终端上的APP成为人们生活中不可或缺的一部分。然而各APP彼此孤立、异构、相互间缺乏数据共享与连锁响应的状况,导致用户在解决复杂任务
在机器学习中,原型选择(即实例选择、样本选择)和属性约简(即特征选择、属性选择)成了数据挖掘中必不可少的步骤,在机器学习中变得越来越重要。属性选择以及样本选择在机器学
分布式电源的开发和利用技术逐渐获得发展。微电网作为分布式电源接入主网的中间过渡,极大地降低了各类分布式电源并入主网所造成的冲击和振荡。逆变器是整个微电网的核心部
近年来,随着信息技术突飞猛进的发展,网络在国计民生中发挥着日益重要的作用.同步控制作为网络研究中最基本也是最重要的研究问题,受到了广泛关注.由于分数阶微积分可以更好地描述复杂系统变量的记忆和遗传性质,与此同时,时滞的不可避免性激发了学者们对具有时滞耦合的分数阶动力网络的同步研究.因为Caputo分数阶导数不满足算子的合成性质,导致了我们很难构造合适的李雅普诺夫函数来处理时滞项并获得实用的代数判据,
红花为菊科红花属植物红花(Carthamus tinctorius L.)的干燥花冠,是我国传统中药,具有抗肿瘤、抗氧化和抗炎等药理作用。黄酮醇及其糖苷类化合物是红花的主要活性成分之一。