基于深度强化学习的无人车控制系统的设计与实现

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:jstxwt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着我国经济的迅猛发展和人民群众生活水平的大幅提高,我国小型家用汽车的数量快速增长,由此带来的道路交通问题也日益严重。随着市场需求的增长和科技的日益成熟,无人车的研究在近几年发展迅速。本文以无人车作为研究对象,针对基于深度强化学习的无人车自动驾驶任务展开研究。本文旨在实现一个具备自动驾驶功能的无人车实验模型,并以此模型来探索和验证无人车自动驾驶的相关理论和技术。在无人车控制系统的实现中,本文使用了深度强化学习理论。在使用深度强化学习理论实现无人车的控制系统时,需要进行大量的训练,这个在实际操作中实现难度很高,因此本文提出了使用仿真平台进行无人车控制系统的训练工作。因为在仿真平台和实际环境之间存在差异,所以训练之后的神经网络模型无法直接应用于无人车中。针对该问题本文提出了使用图像语义分割的技术,用来消除仿真平台和真实环境的差异,使得本文中在仿真平台上训练的模型可以直接应用到无人车任务中。本文的主要研究成果可以归纳如下:第一,本文设计实现了图像语义分割系统。在图像语义分割系统的设计实现过程中,本文充分考虑了该系统之后的应用环境。在实际的应用中,本文所使用的车载的计算机性能无法与实验室中的大型计算机相比。因此在控制系统的设计实现过程中,本文要求该系统对计算能力的要求要保持在一个较低的水平上,而且在运行时所需要的功耗也不能太高。同时考虑到无人车任务中对各个系统的响应速度要求较高,因此本文的图像语义分割系统具有很好的实时性。第二,本文设计实现了无人车的控制系统。该系统可以根据输入图像做出决策,控制无人车的各种动作,保证无人车的安全平稳运行。在该系统的设计中,本文主要基于深度强化学习。本文将网络所需要的大量训练过程放在仿真平台上进行,极大的缩短了训练的时间和难度,并且本文在训练中充分发挥了计算机的硬件性能,采用并行异步的训练方式,减小了训练所需要的空间要求,提高了训练速度。第三,本文设计实现了无人车的硬件结构,包括机械结构的设计和控制电路结构的设计。在无人车的硬件设计中,本文努力提高了硬件设施的可靠性和安全性,使用了独立悬挂系统,在硬件上保证了无人车的平稳安全运行。并且本文使用成熟的PID算法作为底层的控制算法,保证了无人车控制系统对无人车的精准控制。第四,本文设计和进行了大量的实验,用来表明算法的优秀性能,验证本文提出方法的可行性。最后,总结了本文进行的设计实现工作和研究内容,并且指出本文在设计和实现中存在的不足,说明了无人车的下一步研究方向。
其他文献
◆健康中国战略的实施将提升全民健康水平,为劳动年龄人口延迟退休和育龄人口的健康生育奠定生理基础。$$◆通过健康水平的提升可以更好地发挥目前劳动力的产出效率,缓解人口
报纸
武汉港地处长江的中游,长江和汉水交汇处,位于华夏腹地,自古就有“九省通衢”之美誉。她内联川、陕、豫、云、贵、湘、赣、皖、苏,外通海洋,是闻名海内外的我囯内河天然良港
人工智能技术的应用为我们的生活带来诸多便利,但也不可避免的带来一系列问题,尤其是高智能的人工智能机器人,对其违法的法律责任认定影响着行政机关的行政执法。
组织二元性中的焦点是企业需要兼顾探索和利用活动,而探索和利用的内涵却在现有的研究中有着不同的理解和定义。本文在梳理组织二元性研究文献的基础上,从组织学习、战略联盟
目的:探讨射血分数保留的心力衰竭(HF-PEF)患者不同中医证型与血清中游离脂肪酸(FFA)及心型脂肪酸结合蛋白(H-FABP)含量的相关性。方法:选取2013年1月——2015年3月入住黑龙
以湖北秦巴山片区农村为研究对象,从产业特点、产业规模和产业效用等方面分析了片区内一二三产业发展现状,总结了目前片区内的五种三产融合模式,为进一步促进三产融合提供理
突发公共事件信息具有海量、分散、多样和复杂等特性。现代化管理信息系统的信息采集、存储、分析和管理功能可以提高突发公共事件的处理效率和决策水平。本文探讨了国内外基
党的十九届四中全会深入贯彻习近平新时代中国特色社会主义思想,全面贯彻落实党的十九大精神,审议通过了《中共中央关于坚持和完善中国特色社会主义制度、推进国家治理体系和治
报纸
信息时代之下的思想政治教育“互联网+”模式创新发展已经成为人们广泛关注的话题。综合审视“互联网+”模式下大学生思想政治教育面临的机遇与挑战,可以发现:“互联网+”模式与