面向多样化参考轨迹的智能汽车高实时预测控制

被引量 : 0次 | 上传用户:yangjunshisb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运动控制决定了智能汽车的行驶性能。模型预测控制(MPC)是轨迹跟踪控制的有效手段,但存在实时性差的缺点。近似动态规划(ADP)以离线训练在线应用的方式提高了实时性,但存在离线训练慢和难以应用于多样化交通场景的问题。为此,本文构建了依托最优松弛系数的时域分解迭代框架,提出了时域分解型近似动态规划训练方法,以此为基础设计了面向多样化参考轨迹的跟踪控制策略,为自动驾驶汽车的高实时轨迹跟踪控制奠定了基础。首先,围绕最优控制问题时域分解收敛慢的难题,提出了一种依托最优松弛系数的时域分解迭代架构。利用交替方向乘子法的最优性条件得到满足收敛性需求的松弛系数取值区间,并建立松弛因子和收敛速度的两阶段选择条件。进一步结合最优控制问题单优化变量的数学形式,辨识了松弛系数同迭代效率间的正相关关系,获得了最优松弛系数。对比原有迭代架构,该时域分解架构最多可减少63.7%的迭代次数。然后,针对长时域最优控制策略训练速度慢的挑战,提出了适用于并行计算的时域分解型近似动态规划求解方法。通过引入一致性变量实现系统状态的解耦,将原问题沿预测时域拆分为多个短预测时域的子问题。设计了冗余状态作为网络输入,保证了子问题间相互独立的特性;结合最优松弛系数的时域分解架构,构建了策略网络参数的并行训练机制。仿真表明:对于长预测时域问题,使用该方法的策略网络训练时间减少了 83.6%。进而,面向复杂道路场景的智能汽车运动控制,设计了适用于多样化参考轨迹的跟踪控制策略。通过设计四类典型的参考轨迹和两类参考速度,近似多样化交通场景的状态空间。百度Apollo仿真表明:策略网络实现了连续道路直行、换道和掉头等任务。与MPC相比,速度跟踪误差降低了 0.017m/s,轨迹跟踪误差增加了 0.9cm,决策效率提高了 153.1倍,且累计跟踪损失更小。总之,在跟踪性能相当的前提下,ADP算法极大提高了控制实时性。最后,依托百度提供的Apollo实车平台,部署了面向多样化参考轨迹的策略网络,完成校园场景环形道路的轨迹跟踪控制实验。实验表明:所学习的策略网络可平顺地完成直行、转弯等任务,与MPC相比,轨迹跟踪误差降低了 2.1cm,决策效率提高了 65.8倍,速度跟踪误差仅增加0.021m/s。进一步证明在不损失跟踪性能的前提下,所提方案极大提高了在线控制实时性。
其他文献
充分了解岩体结构及质量特性是各类岩体工程安全的前提。传统岩石特性评价主要采用钻孔取芯、地球物理探测等方法,不仅耗时耗力,且难以大规模实施,因此,寻求更科学的岩体特性评价方法是相关科研工作者不懈努力的目标。本文以岩土工程钻孔作业为研究对象,通过理论分析、室内试验及模拟研究等方法,充分挖掘和对比不同随钻响应指标与岩体特性间的关系,建立基于钻进响应的岩体特性评价方法,为智能钻探提供参考和依据。主要研究工
学位
过渡金属及其化合物纳米晶在材料科学和工业应用中具有重要的意义。设计和制备具有理想结构和性质的工业级纳米晶无疑是能源、催化、信息以及生物医药等领域最重要的挑战之一,这需要深入了解纳米晶在制备过程中原子尺度下的成核以及生长机制。原位透射电子显微镜(TEM),特别是环境透射电子显微镜的快速发展为揭示纳米晶的成核生长机制提供了可能性。根据原位环境透射电子显微镜的研究进展,本文将围绕过渡金属纳米晶的成核和生
学位
作为高势能人造泥石流风险源,尾矿库一旦发生溃坝,不仅会威胁下游人民群众的生命安全,也会损坏周边的设施设备,引发环境破坏等问题。本文以尾矿库溃坝为核心,运用了证据、机器学习、三维风险矩阵、领结模型、云模型、交互式多准则决策模型等多种方法、模型,对尾矿库溃坝风险评估与预控方法进行了研究及应用。研究成果总结如下:(1)溃坝隐患辨识及演化关系分析研究基于证据,辨识出了 116种溃坝隐患,并建立了隐患清单。
学位
电解水技术是当代解决能源危机的新希望,它由两个重要的半反应—析氧(OER)反应和析氢反应(HER)组成。为了克服制约着OER和HER的高能量势垒,需要高效的新型催化剂。在本论文中,我们通过各种合成方法,设计制备了多种OER和HER催化剂,并对其性能和物理机制进行了探索。1、Cu2O是合成过渡金属氢氧化物/羟基氧化物的理想模板材料,而后者这类材料具有高效的OER催化性能。我们受Pearson原理的启
学位
致密气是具有较大潜力的非常规天然气资源。致密储层内部发育有纳米和微米级的孔喉,强非均质性使得气水分布情况复杂,流体的渗流规律不再符合达西流动,开采多采用水平井压裂的开发方式,压裂形成复杂的裂缝网络,流动存在多重介质复杂流动问题,气水流动规律认识不清,难以准确预测含水致密气藏压裂水平井两相产能情况,生产过程中的压力传播规律不明。本文以鄂尔多斯大牛地气田为目标区块,通过室内实验、理论分析和数值模拟相结
学位
弱胶结岩石是广泛分布于我国西部地区的一类特殊岩石,具有成岩时间晚、胶结性差等特征,导致该类岩体工程大变形问题、支护困难易失效等灾害频发。弱胶结岩石物理力学行为受应力水平影响极为敏感且破坏机制复杂,是我国西部地区岩土工程问题中普遍面临的基础共性难题,揭示不同应力水平对弱胶结岩石变形、宏细观破坏力学机制,对指导相关工程设计、提高工程灾害预测预报准确性具有重要意义。本文以国家自然科学基金高铁联合基金重点
学位
赤泥是氧化铝生产过程中产生的污染性固体废物,由于赤泥排放量大,利用率很低,只能依靠堆场堆存,占用了大量的土地并造成了严重的污染。而本文率先提出了赤泥部分替代水泥制备钢管混凝土的思路,通过对比分析的研究方法完成了赤泥混凝土基本力学性能的研究和钢管赤泥混凝土静力性能的研究。取得的主要成果如下:(1)赤泥混凝土具有较好的力学性能,提出了赤泥替代部分水泥制备钢管赤泥混凝土的新思路。分析了赤泥替代率、长径比
学位
“崩塌灾害什么时候可能发生”一直以来是崩塌灾害监测预警的痛点问题。由于我国存在着数以万计的崩塌灾害隐患点,利用实用有效的监测技术与预测理论做出可满足应急避险需求的灾害时间预报是现阶段的关键研究目标。拉裂型崩塌是危岩体崩塌的主要类型,由于拉裂型危岩体崩塌前兆不明显,预测预报研究进展缓慢。现有研究指出:倾斜变形是拉裂型危岩体最主要的变形行为,固有频率能够表征拉裂型危岩体的稳定性趋势变化,而倾斜角度传感
学位
随着环境保护意识的提高、充填技术的发展及安全开采工作的重视,充填法已成为金属矿山地下开采重要的采矿方法,其成功实施的关键在于保障充填体的稳定性。其中,爆破作为金属矿山充填开采的主要手段,产生的爆破扰动是导致二步回采过程中充填体失稳的主要原因之一。为降低相邻采场爆破作用对充填体的损伤破坏,本文以爆破扰动下充填体损伤控制问题为导向,针对如何实现爆炸能量有效控制、减少对充填体损伤破坏程度的技术难题,主要
学位
各向异性和粗糙度是影响砂土及砂土-结构接触面力学特性的重要因素,合理描述砂土和砂土-结构接触面的宏观力学行为必须考虑各向异性和粗糙度的影响,因此,建立能够反映砂土各向异性及粗糙度影响的砂土和接触面本构模型具有十分重要的研究意义和应用价值。论文基于经典的Wu-Bauer亚塑性模型,考虑组构各向异性及其演化的影响,建立了各向异性砂土亚塑性模型,并在此基础上考虑各向异性状态参数对砂土密度函数的影响,进一
学位