基于多主体强化学习的碳能复合流无功优化算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:gloria2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着温室效应给环境带来的影响日益严重,低碳经济逐渐成为各能耗工业的重点发展方向,电力工业作为最大的碳排放行业,将在低碳经济发展中担任重要的角色。为了准确核定电力系统各环节的碳排放量,碳排放流的分析方法应运而生。本文结合电力系统能流和碳排放流的传输特性,把能流和碳流视为整体,并充分考虑源网荷之间的碳排放责任分摊,建立了计及碳排放责任分摊的碳能复合流无功优化模型。由于发电侧、电网和用户侧承担着实际碳排放量中的相应份额,电网需要为承担的碳排放责任付出经济成本。碳能复合流无功优化比之传统的无功优化,最大的差异就在于无功优化过程中还考虑电网承担的碳排放责任问题,即是说在电网的无功优化过程中,即需要考虑有功网损的降低,也要注重有功网损所对应碳排放量的减小。强化学习在运用过程中,只有单一主体在进行迭代计算,收敛速度偏慢,本文结合强化学习和群智能算法思想,提出了多主体强化学习的粒子群Q(λ)学习算法,通过多个主体的协同寻优,可以获得远快于单主体强化学习的收敛速度。把算法应用于小规模电网碳能复合流无功优化问题,仿真算例验证了计算结果的有效性,为后续多主体强化学习的协同寻优奠定了基础。随着电力系统规模的扩大,控制变量增多,强化学习的普通算法也面临着和其他智能算法相同的局限性——维数灾问题。为了进一步克服“维数灾”问题,本文采用了Q学习解空间降维的方法,将一个大规模Q值矩阵转化成多个小规模Q值矩阵组成的Q值矩阵链,在保持变量内部联系的同时大大减小状态、动作空间,降低了寻优的难度。另外结合帝国主义竞争算法的思想,提出了帝国主义竞争Q学习算法这样一种新颖的多群多主体强化学习算法,通过多个帝国间的竞争和各个帝国内部的协同搜索同化过程,最终获得问题的最优解。文化矩阵的关联记忆特性使得算法可以实现快速寻优,更好地适用于求解大规模电力系统的碳能复合流无功优化问题。仿真算例表明该算法在保留强化学习的优异收敛特性的前提下仍能具备明显的速度优势,为实际电网的在线优化决策提供了理论支持。
其他文献
TRIPS-Plus知识产权执法是国际知识产权执法新趋向。将边境执法措施适用于过境货物是推行高标准知识产权执法的重要举措之一。以欧美为首的知识产权强国不仅在其域内提高其知
世界经济进入了周期性弱复苏阶段。低通胀、缓增长、高杠杆和高资产价格构成了弱复苏周期的特点。持续复苏具备一些良好的条件,但金融资产价格高企带来的金融周期的不稳定性
我国的养老保障制度从无到有,在改革发展过程中取得了显著成效,但近年来随着人口老龄化日趋严重、未富先老局面的快速临近,养老保障制度的可持续性面临基本养老保险财政“兜底”
会议
针对卓山变电站存在供电不连续的问题,提出新增220kV备自投装置,通过对该装置的安装、单体调试、接入系统整组调试、启动等程序,实现了新增220kV备自投装置的功能,得出了在卓
目前,对于是否继续坚持开发式扶贫方针存在不同看法。文章认为:国际经验与国内实践表明,开发式扶贫方针是我国政府农村扶贫政策的核心和基础,必须坚持。但是,在新的形势下,开
十三届全国人大一次会议7日上午在北京梅地亚中心举行的记者会上,财政部部长肖捷表示,今年将按照党中央、国务院部署,继续实施减税降费政策,进一步减轻企业负担,让市场主体能够迸
报纸
<正>中共十八届三中全会对全面深化改革做出了重大部署,要求紧紧围绕使市场在资源配置中起决定性作用,在一系列领域深化经济体制改革。新时期的改革既是过去改革的继续,又是
目的:分析前列腺癌灶ADC值比率大小与PI-RADS V2中癌灶DWI评分高低的相关性,探讨前列腺癌灶ADC值比率定量分析癌灶DWI评分的价值。方法:搜集2015年3月至2016年12月间在皖南医
本文在分析当前全民创业和汽车售后服务业大发展的背景下,对汽车维修专业学生创新创业能力的培养与创新创业孵化提出了相关的思路与措施,并为保障其工作有效地开展,提出了政策保