【摘 要】
:
随着当代科学技术的不断发展,人们的生活水平不断提高,汽车产业得到了飞速的发展。同时随着汽车数量的快速增长,由停车点的数量和空间紧张而引起的停车事故的发生率也在不断增加。而对于经验不足的驾驶员来说,泊车事故的发生往往是由频繁的错误操作或过度紧张造成的。因此,自动泊车技术成为了智能汽车领域研究中的一个重要研究课题。本文即采用了强化学习算法来对平行泊车及垂直泊车两种常规泊车工况下的自动泊车控制策略进行设
论文部分内容阅读
随着当代科学技术的不断发展,人们的生活水平不断提高,汽车产业得到了飞速的发展。同时随着汽车数量的快速增长,由停车点的数量和空间紧张而引起的停车事故的发生率也在不断增加。而对于经验不足的驾驶员来说,泊车事故的发生往往是由频繁的错误操作或过度紧张造成的。因此,自动泊车技术成为了智能汽车领域研究中的一个重要研究课题。本文即采用了强化学习算法来对平行泊车及垂直泊车两种常规泊车工况下的自动泊车控制策略进行设计。为了凸显基于强化学习的自动泊车控制策略的优势,本文首先基于模糊控制理论对平行泊车与垂直泊车两种常规工况下的控制策略进行设计。通过结合驾驶员泊车经验以及模糊理论,设计两种常规泊车工况相关的隶属度函数,并基于模糊逻辑理论设计常规泊车工况下的模糊规则,从而实现模糊控制策略的设计。为验证其可行性,基于PreScan搭建了两种常规泊车工况的虚拟场景。并在Simulink中搭建模糊控制模型进行实验验证。实验结果表明,基于模糊理论的自动泊车控制策略在常规泊车工况中能够有效地控制车辆泊车入位。更重要的是根据常规泊车工况建立高度保真的泊车环境用以训练强化学习模型。然后,基于强化学习理论,提出了一种基于Q学习算法的自动泊车控制问题。选取后轴中心坐标作为状态变量,前轮转角作为动作变量,以车辆距目标泊车位置的距离的倒数作为控制策略中的奖励函数。通过状态变量和动作变量设计的三维Q表,其值由当前状态的即时奖励和下一状态的最大Q值的衰减值构成。同时由于三维Q表的查值复杂程度较高,因此设计降维方法对Q表中的二维状态变量进行降维处理,从而实现计算的高效性。除此之外,为使得更多动作被探索利用的概率增加,以便于保证在全局范围内筛选出最优动作,因此本文设计了ε贪婪算法用来探索和利用最优动作,从而在遇到障碍物时能够使车辆实现自主的学习过程。基于上述对Q学习算法在自动泊车控制策略中的应用分析,本文基于Python分别对平行泊车、垂直泊车两种常规工况下的自动泊车控制策略以及非常规工况下的自动平行泊车控制策略进行设计并验证。同时,为进一步验证离线训练得到的Q表的可行性,基于dSPACE自动驾驶模拟平台,通过联合MATLAB/Simulink与PreScan搭建了自动泊车硬件在环仿真测试系统。该系统包括电气柜、轮速模拟平台、底层执行机构以及平行泊车PreScan虚拟场景,用来模拟真实的平行泊车驾驶场景。基于该系统实现对自动平行泊车控制策略的硬件在环仿真测试。结果表明,设计的基于强化学习的自动泊车控制策略能够准确地实现泊车入位功能。
其他文献
钛酸铋钠(Bi0.5Na0.5Ti O3,简写BNT)基陶瓷作为一种无铅弛豫介质材料,凭借其优异的铁电、压电性能被应用于功能器件中。近年来,随着高新技术的发展,探索其在储能方面的特性已成为研究热点。纯BNT陶瓷本身的性质限制了其在储能和充放电等领域的应用。本文以BNT基陶瓷为基体,通过类钙钛矿结构组元固溶或者离子掺杂取代的方法,采用传统的高温固相合成工艺制备了BNT基无铅储能陶瓷,增强基体陶瓷的弛
改革开放以来,我国城镇化飞速发展,经历了生产生活方式、社会经济和地理空间的深刻变革。我国总体城镇化率从1979年的17.9%上升到2019年的60.6%,城镇人口数已从1.79亿增长到8.48亿。城镇化是指人口向城镇聚拢并推动城镇发展的一系列过程,其影响城市的人口、生态、经济发展等方面,其中人口城镇化与城市空间扩展尤为明显。2015年广州全市城镇化率已达85.53%,天河区已经实现全区100%人口
挖掘机在减轻劳动强度、提高工程效率上起着重要的作用,因此广泛运用于多个工程领域中。目前我国正大力着手于节能减排、环保安全基础设施建设,鉴于以前传统的产品结构设计理论偏于保守的问题,对挖掘机进行轻量化设计研究亦是大势所趋。工作装置作为挖掘机挖掘作业的主要执行者,它的工作性能要求决定着整个挖掘机的使用效率,因此在满足其工作强度及刚度要求下,对工作装置进行结构优化设计是一种既能减少制造成本又能提高工作性
铝毒是酸性土壤中影响植物生长、导致农作物减产的一个重要因素,我国华南地区的酸性土壤中铝毒危害日渐严重,传统的撒石灰等物理化学方法会对土地资源造成不可逆的伤害,所以探究开发出新型的生物处理方法,是解决土壤铝毒害对农作物生长影响的必经之路。植物在生长过程中会进化出一系列的抗铝机制,而水通道蛋白家族已经被证实具有转运铝,减轻铝毒害的作用,因此克隆相关水通道蛋白基因,构建基因工程菌株,用于铝毒危害严重的环
2020年,党在十九届五中全会中进一步强调全面推进乡村振兴战略,将其列为新时代国家层面的重大发展战略,其重要性显而易见。乡村作为农民生产生活的空间,是乡村振兴的核心实施载体。当下以乡村振兴为背景的建设案例层见迭出,但存在诸多问题,如乡村景观规划脱离产业发展、村庄面临生态安全及景观同质化等问题,乡村发展呈现出不可持续性。综上所述,为实现“产业兴旺、生态宜居、乡风文明、治理有效、生活富裕”的目标,对乡
随着科技的迅速发展,无人机在军事和民用领域得到了广泛的应用。地面站系统作为无人机系统的指挥中心,在整个无人机系统中具有极其重要的地位,研究地面站系统涉及到的相关技术和开发流程具有很大的实际意义。本文首先介绍了无人机地面站和航迹规划的研究背景和发展现状,接着介绍了无人机遥测遥控技术的基本原理和硬件软件设计方案;然后为了应对目前无人机数据传输链路内传输的数据类型和数据量的不断增加,本文采用了CCSDS
因细菌感染而引起的疾病常常危害着人们的健康,在未发现抗生素以前,人类对感染引起的疾病常常束手无策,青霉素的发现拉开了人类对抗细菌感染药物研究的序幕。随着抗生素进一步的开发,人类受益于抗生素带来便利的同时也因抗生素耐药产生的系列问题而饱受困扰。目前已经报道了几种重要的耐药细菌对人类健康产生了极大地危害:比如对万古霉素和甲氧西林耐药的金黄色葡萄球菌(MRSA)或是对碳青霉烯类耐药的G+(如P.aeru
磁感应成像(Magnetic Induction Tomography,简称MIT)技术是一种新型电磁成像技术,由于其具有非侵入性和非接触性的特点,目前已成为生物医学领域的研究热点。MIT技术利用相位检测技术获取待测物体内部涡流信号,通过图像重建算法重构被测物体电导率分布。经典MIT技术中忽略了由电磁波传播延迟应所引起的相位滞后对涡流信号相位检测准确度的影响,为此本文对电磁波传播延迟在MIT技术中
电熔氧化镁熔炼过程生产工艺复杂并且容易发生故障,由于难以建立精确的数学模型,所以采用基于数据的过程监测方法对电熔氧化镁熔炼过程进行监测。为了解决获取电熔氧化镁熔炼过程标记数据难度较大以及如何使用软标记数据的问题,提出基于可信软标签线性判别分析的过程监测方法。为了解决电熔氧化镁熔炼过程中图像数据维数过高,建模或者在线监测过程中计算速度较慢的问题,提出了基于双向二维稀疏正交判别分析的过程监测方法。因为
锰氧化菌是一类重要的环境微生物资源,其菌体及产生的锰氧化物在污染水体中均有巨大应用潜力。为探索新的锰氧化菌种质资源,并初步考察其在实际水处理中应用可行性,本研究从崇左市大新锰矿排土场土壤中富集、分离和纯化出了6株具有锰氧化能力的锰氧化菌,并命名为H1、H2、H3、H4、H5、H6。以这6株锰氧化菌为研究对象,通过16S r RNA基因序列比对和进化树构建确定菌株分类种属。然后分别通过扫描电镜-能谱