基于深度强化学习的自动驾驶车控制算法研究

来源 :郑州大学学报:工学版 | 被引量 : 0次 | 上传用户：yyslzm2007

【摘要】

：

为了提高基于强化学习的自动驾驶车控制算法的学习效率,提出了一种结合专家经验的自动驾驶策略学习算法(deep deterministic policy gridient with expert,DDPGwE)。DDPGwE采

【作者】

：

王丙琛司怀伟谭国真

【机构】

：

大连理工大学计算机科学与技术学院

【出处】

：

郑州大学学报:工学版

【发表日期】

：

2020年4期

【关键词】

：

神经网络强化学习自动驾驶 DDPG算法 actor-critic网络 LSTM neural networkreinforcement learningau

【基金项目】

：

国家自然科学基金委员会与辽宁省联合基金重点支持项目(U1808206)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了提高基于强化学习的自动驾驶车控制算法的学习效率,提出了一种结合专家经验的自动驾驶策略学习算法(deep deterministic policy gridient with expert,DDPGwE)。DDPGwE采用基于DDPG的强化学习框架进行模型在线训练,使用真实的人类驾驶数据对actor网络进行预训练,同时在actor网络中加入LSTM预测机制,提升自动驾驶车对将要发生状况的预判。在仿真平台TORCS中的实验结果表明,所提算法相较于原始DDPG算法,训练时间大大缩短,收敛速度加快,提高了模型

其他文献

老去的是岁月不变的是信仰

91 岁的离体干部周永开，拥有74年党龄。在亲友眼中，他是艰苦朴素、舍小家为大家的“老爷子”;在同事眼中，他是至纯至粹、对党至忠至诚的“周书记”;在群众眼中，他是用心谋事、真情做事的“周老革命”。在周永开同志的身上，体现了对党忠诚、勤勉为公的崇高形象，平易近人、艰苦朴素的崇高境界，不为私利、清正廉洁的崇高情操。他是一面永不褪色的旗帜，春去春又来无声飘扬着那令人景仰心醉的红;他是一朵朴实的小花，散发

期刊

信仰艰苦朴素干部党龄群众

高校实验室网络化信息管理平台的研究与实现

实验室是高等学校的重要组成部分，构建一个内容丰富、功能完备、交互性强的高校实验室管理网络平台，是目前提高高校实验室管理效率的主要手段之一。本文分析了高校实验室网络管

期刊

实验室信息管理网络平台

基于拉丁超立方抽样的改进型多链DRAM算法求解地下水污染反问题

针对运用贝叶斯统计方法求解地下水污染反问题时,经典MCMC算法(Metropolis算法)求解结果受样本初始点影响且计算效率低的问题,提出了一种基于拉丁超立方抽样方法的改进型多链

期刊

二维水质模型贝叶斯-马尔科夫链蒙特卡洛法拉丁超立方抽样延迟拒绝自适应Metropolis算法污染源识别two-dimensional water qu

基于混合遗传粒子群优化算法的层次路径规划方法

路径规划是移动机器人研究领域的一个重要基础性问题。针对单独使用某一路径规划算法存在着搜索速度慢,或易陷入局部极值的问题,提出了一种基于混合遗传粒子群优化算法的层次路径规划方法。该方法的主要步骤包括:一是采用三角形法进行空间环境路径建模;二是结合人工势场法的改进遗传算法设计初次路径规划;三是运用粒子群优化算法对初次路径规划的结果进行优化以实现更可靠的最优路径。通过实例仿真测试,结果显示所设计的方法能

期刊

移动机器人路径规划人工势场法改进遗传算法粒子群优化算法三角形法mobile robotpath planningartificial potenti

现代人是如何被电梯广告逼疯的

忙了一天，拖着疲惫的身躯，走进单元门，广告屏幕的嚎叫立刻传来：“找工作！和老板谈！拍婚纱照！去罗马拍！去巴黎拍！你要换好车！免单！免单！免单！”记者脑壳很痛。　　丑拒？没门！在大声出奇迹的电梯里，手机信号又不好，在那几十秒里，你的好奇或痛苦，往往取决于商家的脑洞，然后来一个灵魂拷问，意不意外，惊不惊喜？　　被电梯广告支配的恐惧　　软文说了，有趣的电梯广告不仅可以打发候梯时间，缓解密闭空间的尴尬，

期刊

广告现代人电梯婚纱照

智慧城市的理政之路

自从四川某县建设使用民生大数据监督平台，当地一些纪检监察干部轻松了不少，从前核查问题时复制粘贴制作表格、用公式计算的日子一去不复返。当地村民想知道谁享受了哪种补贴、有多少钱，在手机上就能看个一清二楚。更重要的是，系统还可以通过大数据比对，自动发现问题线索，有关数据不匹配时，系统会自动预警，发现违规违纪现象，即使“民不告”，官也要“究”。　　监管公示惠民惠农资金、宣传民生政策、群众在线监督举报……此

期刊

自动预警违规违纪现象纪检监察干部大数据复制粘贴智慧城市数据比对问题线索

母岩变形特性差异对堆石料力学性质的影响

针对当前研究中很少甚至忽略母岩变形特性对堆石料力学性质的影响,采用大型静力三轴仪及大型渗透仪,分别进行了2种堆石料三轴试验和渗透试验,得到了不同岩性堆石料强度、变形

期刊

堆石料母岩变形特性力学性质影响rockfill materialsmother rockdeformation characteristicsmech

基于深度强化学习的自动驾驶车控制算法研究

其他学术论文