基于强化学习的插电式混合动力汽车能量管理策略研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户：wwjnb2009888

【摘要】

：

【作者】

：

胡恒杰

【出处】

：

昆明理工大学

【发表日期】

：

2020年01期

【关键词】

：

插电式混合动力汽车能量管理随机动态规划强化学习随机模型预测控制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

迫于环境恶化和能源短缺的压力,插电式混合动力汽车成为当代最具有发展潜力和市场前景的新能源车型。作为插电式混合动力汽车的关键技术,能量管理策略直接影响了车辆的燃油经济性和排放能力。本文以功率分流式混合动力汽车为研究对象,研究了基于随机动态规划、基于强化学习以及基于随机模型预测控制三种不同的能量管理策略,具体的研究内容包括:(1)详细介绍了功率分流式混合动力汽车的动力系统结构,分析了不同驱动模式下各动力部件的能量传递情况,建立了功率分流式混合动力汽车的能量管理控制模型,确定本文控制策略需要优化的控制变量和目标函数。(2)研究了基于随机动态规划的能量管理策略。首先介绍了随机动态规划过程的基本原理,分析并比较了三种解决随机动态规划模型的方法。混合动力汽车的随机动态规划将未知工况的不确定性用车辆的需求功率转移概率表示,将多个标准工况的需求功率进行非线性离散化并用马尔可夫链进行建模,采用改进的策略迭代方法对随机动态规划控制问题进行求解,得到离线的随机动态规划最优电池功率序列。通过在线仿真验证,结果表明该方法能有效减少燃油消耗量,并且对工况的适应性较强。(3)研究了基于强化学习的能量管理策略。首先分析了强化学习与马尔科夫决策过程的关系,介绍了强化学习的基本原理知识,并阐述了常见的3种强化学习算法,确定利用易于收敛的Q-learning算法作为能量管理控制算法。利用Qlearning算法对能量管理问题进行建模,结合随机动态规划模型中建立的关于需求功率的马尔可夫链模型,采用值迭代的方法求解强化学习最优控制问题,得到离线的Q-learning最优控制器,并对不同状态下算法的收敛性进行比较分析,确保控制算法的收敛。仿真分析结果表明,基于Q-learning算法的策略能有效提升燃油经济性,能够实现和随机动态规划相近的次优结果。(4)提出一种基于强化学习的随机模型预测控制算法。建立基于加速度的马尔可夫链模型,提出两种随机速度预测方法,分析造成精度差异的原因,采用精度较高的多步马尔可夫速度预测作为随机预测模型。将Q-learning离线控制器用于在线滚动优化过程中,建立一种能够在线控制的基于强化学习的随机模型预测控制器。仿真结果表明,该控制器能有效提高燃油消耗率,同样能获得接近于随机动态规划的结果。此外,还分析了预测精度对控制器的影响、控制器对不同SOC参考轨迹的跟随效果以及对不同工况的计算效率,结果表明所提出的随机模型预测策略能够保证计算效率,提高燃油经济性。

其他文献

纳米多孔金在气相催化过程中表面重构行为的原位表征

表面重构是气体催化反应过程中的常见现象。一般情况下,在气相催化反应过程中,由于表面含有的低配位数原子较多且先接触到反应气体,因此是催化反应发生的主要位置,表面原子也

学位

透射电子显微镜原位气相系统纳米多孔金表面重构晶面调控

动作类电子游戏不同水平人群脑电节律研究

动作类电子游戏(Action video game,AVG)已成为人们日常生活中不可或缺的一部分。在复杂拟真的游戏环境中,动作类电子游戏玩家需要对游戏中的各类信息进行记忆,并对快速移动的目标和快速变化的环境做出准确的反应。因此,AVG作为一种新兴的自然情景范式刺激,越来越受到研究者的关注,并逐步用于研究大脑及其认知功能的可塑性机制。先前研究表明,大脑的节律活动能够反映诸如注意、记忆等多种脑认知功能

学位

动作类电子游戏特质焦虑脑电节律机器学习自然情景范式刺激

生物柴油喷射火焰混沌识别及燃烧排放性能研究

生物柴油作为一种清洁能源,通常以动植物油脂等为原料经过酯交换化学反应制成,制备成本低廉且过程简单,可以作为替代化石柴油的新能源。基于其制备原材料的广泛性、可再生性以及燃烧后的低排放性等特性,吸引了大批国内外学者的研究,以期将其应用于各个行业。目前对于生物柴油的应用研究大多集中在内燃机中,关于生物柴油工业炉窑内的应用较少。本文对此进行了生物柴油工业炉窑内燃烧试验,研究了生物柴油炉内燃烧的火焰特性、排

学位

生物柴油排放特性混沌识别时间序列三态测试

乌市小学综合实践活动课程的实施现状及策略研究

历经近20年的发展,综合实践活动课程逐步进入大众视野,并获取了大量研究成果和成功案例,为其后续发展积聚了经验。但具体到综合实践活动课程的开展上,许多方面仍然存在问题,当前研究也多集中在这一块。再者,反观综合实践活动课程的外部支持方面,无论是意识层面还是实践层面,都聊胜于无。本研究采取问卷调查、访谈法、文本分析、案例分析等方法对乌鲁木齐市8所小学综合实践活动课程的实施现状及外部支持情况开展调研,并对

学位

小学综合实践活动课程实施现状问题策略

SCD基因表达对苏尼特羊血液组织中脂肪酸组成的影响

本试验旨在了解硬脂酰辅酶A去饱和酶(SCD基因)在不同种群苏尼特羊血液中的表达规律以及该基因与脂肪酸组成和含量的相关关系,从基因角度验证苏尼特羊风味独特、营养价值高的根本所在。试验采集放牧的3岁苏尼特公、母羊血液各20份作为试验材料,采用气相色谱法对样品中脂肪酸的组成与含量进行了测定;以SCD基因为目的基因,利用荧光定量PCR技术对样品中SCD基因表达量进行检测计算；分析SCD基因表达量与相关脂肪

学位

苏尼特羊SCD基因血液脂肪酸表达量

基于邻近项的广义交替方向乘子法研究

交替方向乘子法(ADMM)是一种求解可分离凸优化问题的有效工具,在诸多领域都有着广泛的应用.相比于原始ADMM,广义交替方向乘子法在迭代速度和数值效果上均有着明显的优势.近年来,学者们对ADMM的研究不断深入和完善.本文主要研究了求解带有线性等式约束的两块可分离凸优化问题的不定邻近项广义Peacemen-Rachford(PR)分裂法和惯性邻近广义交替方向乘子法.第一部分,在广义PR分裂法中改变其

学位

凸优化Peaceman-Rachford分裂法不定性邻近项邻近交替方向乘子法惯性技术全局收敛性

构筑具有全球影响力的都市圈协同创新高地

党的十九届五中全会指出"坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑"。南京都市圈建设作为支撑长三角城市群建设、促进东部地区和中

期刊

都市圈统一大市场协同创新全球影响力

关于总加权误工损失的双代理单机排序问题研究

排序问题是在机器上加工一些工件时,确定加工顺序使效率最高。本文研究单机情况下的双代理排序问题:即双代理都有一些工件需要加工,并且这两个代理中的所有工件只能在一台机器上进行加工。两个代理都期望优化各自的目标函数,且该目标函数只依赖于工件的完工时间。想要满足各个代理目标函数的要求,在于如何在机器上安排这些加工工件的顺序。本文主要研究的问题包括:1)不可中断的总加权误工损失问题。以总加权误工损失作为第一

学位

排序双代理加权误工损失动态规划算法时间复杂度

东濮凹陷油气分布不均一性及其主控因素

以油气形成及分布理论为指导,系统归纳了研究区油气不均一分布的特征,并通过成藏要素的综合研究,剖析油气不均一分布主控因素,建立了油气不均一分布模式。东濮凹陷不同区带、

学位

东濮凹陷油气不均一分布主控因素分布模式

双层网络上的传播动力学建模及分析

传播无处不在,流行病的传播、谣言的传播等都影响着人类的健康和社会的发展等。研究传播背后的机制可以为流行病的预防和控制、促进或抑制消息的扩散等带来重要意义。然而由于许多传播行为都受到层与层之间相互作用的影响,仅由单一网络很难刻画这种复杂性,因此本文在双层网络上分别研究了两种不同模型的传播过程。我们首先考虑了在双重网络中易感-感染-易感的传播过程模型,定义易感者在每一层中都至少有一个感染者邻居才可能被

学位

多层网络传播动力学信息传播相变平均场

基于强化学习的插电式混合动力汽车能量管理策略研究

其他学术论文