基于强化学习的微电网能源调度方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:baby3911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会用电需求的增长、能源产业结构的变化以及产能技术的不断更新,能源调度任务在微电网的能源管理中变得十分重要。传统方法的思路是将其抽象为一个纯优化问题,未能考虑到模型的动态性及不确定性。相比之下,强化学习方法考虑了模型随着时间的推移进行的动态变化,并且可以很好的应对决策过程中出现的不确定性。本文的研究重点是应用强化学习解决微电网能源调度任务当中的决策问题,主要研究内容如下:首先,本文基于强化学习及马尔可夫决策过程的基础理论构建了微电网能源系统模型,对其中的柴油发电机和电池装置分别进行了数学建模,并确立了最小化能源生成成本和保证能源供求关系平衡的优化目标。在此基础上,本文提出了针对有限固定时间步长问题的深度确定性策略梯度(FH-DDPG,Finite Horizon-Deep Deterministic Policy Gradient)算法,创新性的应用了 Multi-Actor和逆向归纳机制,解决了深度确定性策略梯度算法在有限固定时间步长决策问题中存在的训练稳定性较差和收敛速度较慢等问题。仿真结果显示,FH-DDPG实现了能源生成成本的最小化和供求关系的平衡。在上述研究的基础上,本文通过进一步考虑实际场景中由信息不完全性和信息时效性缺失所导致的不确定性,针对微电网能源系统构建了部分可观察马尔可夫决策过程,克服了历史信息采样过程复杂、初始单元历史信息难以获取等困难。然后,本文对观测空间、历史空间进行了定义,并分析了其与状态信息量的区别。最后,本文提出了针对有限固定时间步长问题的循环确定性策略梯度(FH-RDPG,Finite Horizon-Recurrent Deterministic Policy Gradient)算法,并通过对网络进行合理的设计提高了历史信息的利用效率。仿真实验表明,在基于同一时间周期和基于多个不同历史周期的训练和测试中,FH-RDPG算法在能源调度任务中取得了更好的收敛性和模型泛化能力。
其他文献
成本管理是企业经营管理的重心,科学合理规划成本费用是提高管理效率的关键,尤其对于制造业来说,做好成本管控是持续发展的保障。因此,降低成本费用对企业来说至关重要,如何做好成本控制进行科学决策也成为学者们的研究焦点之一。传统成本理论认为,成本费用的高低与业务量的大小存在一种线性关系,也即业务量越多成本费用就越高,反之,业务量越低成本费用也越低。然而在实际经营管理中,业务量的增减变动情况与成本费用的增减
教师培训是一线教师专业发展的重要路径之一,初中阶段化学作为基础教育中的重要学科,教师培训现状的调查研究显得尤为重要。本文重点研究了初中化学教师培训的现状、需求和影响因素,为今后的初中化学教师培训的研究提供证据材料和借鉴意义。本研究主要采用了问卷调查法、访谈调查法和文献研究法。首先,通过文献研究法,系统研究了国内外教师培训的制度、目标、内容、方式、需求和问题。其次,再结合专业知识和专家建议,编制初中
随着互联网技术的飞速发展,越来越多的互联网使用者倾向于将自己的数据信息存储在云端,而现有的云存储系统的安全性饱受人们诟病,不利于保障用户的数据和信息安全。因此,如何有效地保障云端用户数据的安全变得愈发重要。安全云存储系统是解决该问题的关键,安全云存储系统可以通过对用户数据进行加密,切实保障用户的数据安全,具有重要的研究价值和应用价值。本文针对用户的云端数据安全实现了安全云存储系统,其主要功能是:在
随着人们进入全球时代,翻译的地位和作用变的越来越重要。因此,翻译学也受到了学术界的关注。在中韩两国文化交流日益活跃的21世纪,文学翻译作为能帮助彼此轻松理解和沟通文化的媒介,一直发挥着重要作用。随着两国之间文化需求的迅速增长,翻译已不再是个人的主观工作,并且在两国交流的意义上也有了重要地位。因此,翻译家必须准确的将原文所包含的意义转换成译文的过程变得更加重要。目前,随着韩中翻译和中韩翻译的需求日益
弓形虫是一种专性的细胞内原生动物寄生虫,是自然界中分布最广的寄生虫之一,世界上三分之一的人口被这种寄生虫感染。弓形虫感染日益成为一个世界性的、严重的公共卫生问题。目前,针对弓形虫病的治疗药物存在许多局限性,所以开发新型,高选择性、低细胞毒性的抗弓形虫药物变得尤为重要。天然产物是抗弓形虫活性的活性化合物的丰富来源。双氢青蒿素(DHA)是一种传统的抗疟疾药,研究表明DHA也具有抗弓形活性,但活性较低。
利用合成孔径雷达(Synthetic Aperture Radar,SAR)对海面舰船及其尾迹进行检测和监视的技术在海洋遥感领域受到了相当高的重视,现已成为SAR最为重要的应用。鉴于合成孔径雷达所具备的全天时、全天候以及高分辨率的优势,其应用在舰船尾迹检测方面时不仅可以实现宏观、长期、实时地对海洋进行观测,而且可以帮助有效提取出舰船目标的信息。但由于海况以及舰船等因素的影响,尾迹在SAR图像中往往
目的:探讨血小板与淋巴细胞比值(plateletto lymphocyte ratio,PLR)、D-二聚体和CA125在卵巢癌诊断中的价值及与临床病理特征之间的关系。方法:选取2007年1月-2019年11月期间在我院妇科手术治疗病理诊断为上皮性卵巢癌的患者102例为卵巢癌组,病理诊断为良性肿瘤的患者107例为良性肿瘤组,同时选取健康女性110例作为健康对照组。收集卵巢癌组和良性肿瘤组患者的一般
目的:1.制备肾阳虚型骨质疏松(osteoporosis,OP)模型鼠并予不同浓度加味阳和汤灌胃给药,检测大鼠骨密度(bone mineral density,BMD)、骨组织形态,探究加味阳和汤对其的治疗作用及量效关系。2.提取、培养并行成骨细胞鉴定,探究不同浓度加味阳和汤对成骨细胞的增殖矿化作用及量效关系。3.检测血钙、血磷、E2、ALP、β-catenin、LRP5、Runx2含量,探究加味
农业生产中氮素施用过度会对土壤肥力、作物产量和作物品质产生不利影响,因此,减量施氮作为优化施肥的一种高效利用肥效的方式被广泛研究。本研究以泗洪地区设施蔬菜土壤为研究对象,设置有机肥替代化肥(习惯施肥;有机替代10%;有机替代20%;有机替代30%;有机替代40%;有机替代50%;)、水肥一体化(习惯施肥;等磷钾施用量、减氮施用量10%;等磷钾施用量、减氮施用量15%;等磷钾施用量、减氮施用量20%
越野轮胎作为汽车与沙石路面直接作用的部件,其与沙粒间的相互作用极大地影响着越野车辆的行驶通过性、动力性、平顺性、甚至是操纵稳定性和行驶安全性。因此,系统研究车轮与