【摘 要】
:
随着汽车技术的发展,现代社会的交通安全、环境污染等问题日益严重。在此背景下,智能汽车成为热门发展方向,其中无人车控制对车辆安全起着至关重要的作用,是人们比较关心的问
论文部分内容阅读
随着汽车技术的发展,现代社会的交通安全、环境污染等问题日益严重。在此背景下,智能汽车成为热门发展方向,其中无人车控制对车辆安全起着至关重要的作用,是人们比较关心的问题。传统的控制方法具有一定的局限性,当环境过于复杂时,控制器参数也会变的复杂,而且当车辆所处环境发生变化时,原先定义的参数也要进行相应的调整,可是参数往往难以进行自适应调节。深度强化学习算法具有良好的智能控制效果,能实现端到端的控制,比较适合无人车辆的控制,因此本文基于强化学习的车辆控制算法,将深度确定性策略梯度应用于虚拟车控制,并对训练数据进行分类,以不同概率分配训练数据,提高训练速度。本文的主要工作如下:(1)将深度确定性策略梯度算法应用于实现虚拟车的控制。该算法应用高维感知数据作为输入,数据经过神经网络的计算得到控制动作的输出值,虚拟车执行动作命令,然后与环境进行信息交互,通过强化学习学习到好的行驶策略。本文分析了不同场景下的奖励函数设计方法,给出了适合本文场景的奖励函数。(2)深度确定性策略梯度算法训练时存在大量试错的过程,为减少虚拟车试错行为,提高训练速度,本文对训练数据进行分类处理,将有益于车辆到达目的的数据存于好数据块中,其他的数据存于坏数据块中,训练时以不同的概率提取数据进行训练,从而提高训练的速度。(3)通过TORCS平台进行实验仿真,实验结果表明设计的奖励函数具有很好的收敛性,分类处理不同的训练数据可以提高训练的训练速度,减少了虚拟车在学习过程中的试错行为。
其他文献
固体氧化物燃料电池(Solid Oxide Fuel Cell,SOFC)是一种高效清洁的能源转换装置,目前在商业化应用方面主要受到运行性能和寿命的限制。固体氧化物燃料电池长期运行稳定性较差,主要原因是反应气体分布不均引起温度分布不均,造成应力不均,电池出现裂纹、细缝等结构破坏。SOFC的气体分布由电池气道结构决定,受到内部多种物理化学过程的影响。SOFC尺度小,电池中多种物理量相互作用,物理场的
随着中国经济的不断发展,越来越多的企业做大做强,由此,也出现了许多集团式公司,并不断的向多个行业、跨行业进行发展。我们都知道,集团及其下属子公司之间总是有着千丝万缕
计算机博弈是人工智能领域中一个重要的研究方向。作为计算机棋类游戏学习中的一个重要方法,自对弈学习是指仅依赖对弈过程及终局输赢结果的一种学习方式。在整个自对弈过程
随着社会不断进步以及消费升级,餐饮行业迅速发展,从而使得团体配餐的需求不断增大。当前大型连锁餐饮的团体配餐系统普遍存在一些问题:1、配餐物流不合理导致运输成本和时间
目的:检测人类趋化因子 CMTM6(CKLF-like MARVEL transmembrane domain-containing 6)在肺癌中的表达情况,探索其与患者临床病理特征和预后生存间的联系,为肺癌患者的病情评
目前社会老龄化程度在不断加剧,与此同时科学技术也在不断进步,为此市场上逐步出现了兼备护理功能和行驶功能的多功能电动轮椅床,该类产品不仅可以帮助用户进行康复训练,还可
密钥管理作为保障无线传感器网络其他安全机制稳定运行的基础,在无线传感器网络安全领域研究占据着重要的地位。由于无线传感器网络节点的硬件资源并不富裕,其性能的发挥受到
地震是危害人类及对交通工程破坏性较大的主要自然灾害之一,因此研究具有良好抗震性能结构形式的新型桥墩逐渐成为桥梁抗震工程技术的重点。本文结合甘肃省交通厅重点科研项目“钢-混组合桥墩受力性能研究”,提出了建设工期短、质量易于控制、抗震性能好的新型钢-混组合桥墩,该桥墩融合了节段拼装、自复位、约束摇摆隔振的特点。论文先对自复位约束摇摆钢-混组合桥墩的结构形式进行了研究,说明了该桥墩的工作机理以及特点、优
近空间飞行器(NSV:Near Space Vehicle)因其具有持久驻空能力、长航时大范围机动能力、快速进入临近空间响应能力等优势,在未来一体化联合作战中有着重大的军事价值,目前已成
秸秆作为产量最大的农业废弃物一直被列为最重要的生物能源之一,如何高效降解秸秆,进而合理有效利用,将其变废为宝是目前需要解决的首要问题。粗糙脉孢菌(Neurospora crassa)能够分泌纤维素酶对秸秆进行降解。为了提高秸秆降解效果,本文通过基因过表达方法改造粗糙脉孢菌产纤维素酶能力。分析已经获得的3株CBH基因过表达菌株对4种秸秆(玉米、水稻、小麦、高粱)的降解效果。首先考虑到底物对产酶影响问