基于并行深度强化学习的混合动力汽车能量管理策略优化

来源 :重庆理工大学学报:自然科学 | 被引量 : 0次 | 上传用户：niechunming521

【摘要】

：

提出了能量管理策略优化方法,通过深度强化学习中的深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法调整等效因子,以提高燃油利用率,达到SOC保持与油耗降

【作者】

：

李家曦孙友长庞玉涵伍朝兵杨小青胡博

【机构】

：

重庆理工大学车辆工程学院汽车零部件先进制造技术教育部重点实验室,宁波市鄞州德来特技术有限公司

【出处】

：

重庆理工大学学报:自然科学

【发表日期】

：

2020年9期

【关键词】

：

自适应等效能耗最小策略混合动力汽车等效因子并行深度强化学习边缘计算 adaptive ECMShybrid electric vehicleequiva

【基金项目】

：

国家自然科学基金项目(51905061),中国博士后科学基金项目(2020M671842),重庆市自然科学基金项目(cstc2019jcyj-msxm X0097),重庆市教育委员会科学技术研究项目(KJQN201801124),内燃机燃烧学国家重点实验室开放课题(k2019-02)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了能量管理策略优化方法,通过深度强化学习中的深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法调整等效因子,以提高燃油利用率,达到SOC保持与油耗降低的目标。受到边缘计算架构启发,建立了基于并行的深度强化学习算法以加快学习速度。在FTP72工况的仿真结果表明:提出的算法使油耗相对基于PID控制器的传统A-ECMS算法降低了7.2%,而以边缘计算架构建立的并行深度强化学习算法使收敛速度提高了334%。

其他文献

论网络反腐中存在的问题及应对策略

在过去的2013年里，网络反腐呈现高涨状态，但仍面临许多问题。尤其是对于网络反腐，政府是面对还是逃避，公民是自律还是狂欢，以及网络是嘈杂还是净化等问题。相应的，笔者提出政府应该

期刊

政府公民网络反腐

史怀哲敬畏生命伦理学及其生态启示

“敬畏生命”范畴的提出，是史怀哲长期思考和理论探究的成果，爱并且尊敬一切生命，保持生命，促进生命，使生命达到其最高度的发展——是史怀哲敬畏生命伦理思想的核心内容。他对敬畏

期刊

史怀哲敬畏生命伦理学生态启示

未成年人犯罪之文化因素初探

未成年人犯罪的预防和矫正，必须建立在对未成年人犯罪原因的准确把握的基础之上。当前未成年人犯罪日趋严重是由多种因素造成的，文化是其中之一。不良文化毒害未成年人的身心，极

期刊

未成年人犯罪暴力文化色情文化网络文化

表面完整性对18CrNiMo7-6合金钢机械性能的影响

关键构件机械性能的影响因素有很多,如表面形貌、表面应力集中以及表面残余应力状态等。对18CrNiMo7-6合金钢同一工艺下的拉伸试样表面形貌和残余应力进行了测量,得到试样表

期刊

18CrNiMo7-6合金钢表面形貌残余应力表面应力集中屈服强度18CrNiMo7-6 Alloy steelsurface topographyre

基于并行深度强化学习的混合动力汽车能量管理策略优化

其他学术论文