基于深度强化学习的自动驾驶车控制算法研究

来源 :郑州大学学报:工学版 | 被引量 : 0次 | 上传用户:yyslzm2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高基于强化学习的自动驾驶车控制算法的学习效率,提出了一种结合专家经验的自动驾驶策略学习算法(deep deterministic policy gridient with expert,DDPGwE)。DDPGwE采用基于DDPG的强化学习框架进行模型在线训练,使用真实的人类驾驶数据对actor网络进行预训练,同时在actor网络中加入LSTM预测机制,提升自动驾驶车对将要发生状况的预判。在仿真平台TORCS中的实验结果表明,所提算法相较于原始DDPG算法,训练时间大大缩短,收敛速度加快,提高了模型
其他文献
91 岁的离体干部周永开,拥有74年党龄。在亲友眼中,他是艰苦朴素、舍小家为大家的“老爷子”;在同事眼中,他是至纯至粹、对党至忠至诚的“周书记”;在群众眼中,他是用心谋事、真情做事的“周老革命”。在周永开同志的身上,体现了对党忠诚、勤勉为公的崇高形象,平易近人、艰苦朴素的崇高境界,不为私利、清正廉洁的崇高情操。他是一面永不褪色的旗帜,春去春又来无声飘扬着那令人景仰心醉的红;他是一朵朴实的小花,散发
本文从成本管理的理念、技术、机制三个方面的创新为基点.论述了成本管理创新的有效途径。
期刊
实验室是高等学校的重要组成部分,构建一个内容丰富、功能完备、交互性强的高校实验室管理网络平台,是目前提高高校实验室管理效率的主要手段之一。本文分析了高校实验室网络管
针对运用贝叶斯统计方法求解地下水污染反问题时,经典MCMC算法(Metropolis算法)求解结果受样本初始点影响且计算效率低的问题,提出了一种基于拉丁超立方抽样方法的改进型多链
路径规划是移动机器人研究领域的一个重要基础性问题。针对单独使用某一路径规划算法存在着搜索速度慢,或易陷入局部极值的问题,提出了一种基于混合遗传粒子群优化算法的层次路径规划方法。该方法的主要步骤包括:一是采用三角形法进行空间环境路径建模;二是结合人工势场法的改进遗传算法设计初次路径规划;三是运用粒子群优化算法对初次路径规划的结果进行优化以实现更可靠的最优路径。通过实例仿真测试,结果显示所设计的方法能
忙 了一天,拖着疲惫的身躯,走进单元门,广告屏幕的嚎叫立刻传来:“找工作!和老板谈!拍婚纱照!去罗马拍!去巴黎拍!你要换好车!免单!免单!免单!”记者脑壳很痛。  丑拒?没门!在大声出奇迹的电梯里,手机信号又不好,在那几十秒里,你的好奇或痛苦,往往取决于商家的脑洞,然后来一个灵魂拷问,意不意外,惊不惊喜?  被电梯广告支配的恐惧  软文说了,有趣的电梯广告不仅可以打发候梯时间,缓解密闭空间的尴尬,
自从四川某县建设使用民生大数据监督平台,当地一些纪检监察干部轻松了不少,从前核查问题时复制粘贴制作表格、用公式计算的日子一去不复返。当地村民想知道谁享受了哪种补贴、有多少钱,在手机上就能看个一清二楚。更重要的是,系统还可以通过大数据比对,自动发现问题线索,有关数据不匹配时,系统会自动预警,发现违规违纪现象,即使“民不告”,官也要“究”。  监管公示惠民惠农资金、宣传民生政策、群众在线监督举报……此
本文对法务会计的目标、基本假设和对象三个基本理论问题展开讨论。旨在建立与完善法务会计的理论框架。
针对当前研究中很少甚至忽略母岩变形特性对堆石料力学性质的影响,采用大型静力三轴仪及大型渗透仪,分别进行了2种堆石料三轴试验和渗透试验,得到了不同岩性堆石料强度、变形
期刊