【摘 要】
:
为提高燃料电池混合动力汽车的燃油经济性和燃料电池寿命,该文提出一种基于深度强化学习(Deep Reinforcement Learning,DRL)的能量管理策略。该策略首先在DRL奖励信号中加入
【机 构】
:
中国科学院深圳先进技术研究院,中国科学院大学,中国矿业大学
【基金项目】
:
深圳市海外高层次人才创新创业计划项目(KQJSCX20180330170047681),深圳无人驾驶感知决策与执行技术工程实验室计划项目(Y7D004),深圳电动汽车动力平台与安全技术重点实验室计划项目。
论文部分内容阅读
为提高燃料电池混合动力汽车的燃油经济性和燃料电池寿命,该文提出一种基于深度强化学习(Deep Reinforcement Learning,DRL)的能量管理策略。该策略首先在DRL奖励信号中加入寿命因子,通过降低燃料电池功率波动,起到延长燃料电池寿命的效果;其次,通过限制DRL的动作空间的方法,使燃料电池系统工作在高效率区间,从而提高整车效率。在UDDS、WLTC、Japan1015三个标准工况下进行了离线训练,并在NEDC工况下实时应用以验证所提出策略的工况适应性。仿真结果显示,在离线训练中,所提出的
其他文献
该文以无人售货机售卖瓶装饮料商品为研究场景,提出一种基于改进Faster R-CNN算法的瓶装饮料商品目标检测方法。首先,采用残差网络ResNet-50进行特征提取,加深网络对目标特征的提取和学习的深度;然后,根据瓶装饮料商品形态学特征,增加区域建议网络(Regional Proposal Network)的锚框数量和样式;最后,基于所提出的多维特征图融合网络,增强了网络对小目标的检测性能。实验结
工业过程对象普遍存在时滞、模型参数不确定性和外部扰动多等特点,传统Smith预估控制方法难以设计出满足期望性能的鲁棒控制器.针对模型参数不确定性和外部扰动,本文采用自抗
风电、光伏等新型发电设备并入传统大电网后,使互联电力系统日益复杂,给电力系统建模和运行控制带来了新挑战.基于此问题,本文提出基于模糊自适应控制的互联电力系统输出跟踪
随着科技的发展,骨科生物材料已从传统惰性材料渐渐实现了靶向功能调控,并可在降解过程中调控局部骨代谢,促进骨组织再生与功能重建。因此,智能化材料的发展将是今后十年骨科
本文研究概率布尔控制网络的集可控性问题.首先,利用矩阵半张量积方法,得到概率布尔控制网络的代数表示.其次,借助一个新的算子构造不同的可控矩阵,进而通过可控矩阵考虑自由
针对堆叠条件下工件的视觉检测问题,该文提出了一种基于角点特征信息的三角形内间距(Triangular Centroid Distances,TCDs)描述子。首先,对目标局部轮廓角点和方向进行检测;然后,基于检测到的角点和方向信息在模板轮廓上生成疑似轮廓段;最后,对目标轮廓和模板上的疑似轮廓段提取改进后的描述子特征矩阵,并计算目标轮廓矩阵与各疑似轮廓特征矩阵之间的距离,其中距离最小的疑似轮廓段即为
创伤是当今世界各国普遍面临的一个重大医疗及公共卫生问题,各种突发事件和疾病造成的急性出血创面和慢性难愈合伤口仍然是外科临床治疗的挑战。各种复杂创面的修复对目前临
随着城镇化进程的加快,住房公积金制度迅速发展,逐渐成为我国住房保障机制的重要一环。然而,随着住房公积金制度扩面进入深水区与新型城镇化建设步伐的加快,近年来住房公积金
鲸鱼优化算法是一种设计新颖的智能优化算法,近年来已广泛应用于各种工程优化问题.但是关于鲸鱼优化算法的收敛性尚未明确,而且缺乏对算法中合理参数选择范围的理论分析.本文
针对永磁同步电机预测电流控制模型参数失配引起的系统性能下降问题,提出一种基于内模控制观测器的应对策略来矫正模型参数.首先,根据旋转坐标系下的永磁同步电机动态模型,设