论文部分内容阅读
随着温室效应给环境带来的影响日益严重,低碳经济逐渐成为各能耗工业的重点发展方向,电力工业作为最大的碳排放行业,将在低碳经济发展中担任重要的角色。为了准确核定电力系统各环节的碳排放量,碳排放流的分析方法应运而生。本文结合电力系统能流和碳排放流的传输特性,把能流和碳流视为整体,并充分考虑源网荷之间的碳排放责任分摊,建立了计及碳排放责任分摊的碳能复合流无功优化模型。由于发电侧、电网和用户侧承担着实际碳排放量中的相应份额,电网需要为承担的碳排放责任付出经济成本。碳能复合流无功优化比之传统的无功优化,最大的差异就在于无功优化过程中还考虑电网承担的碳排放责任问题,即是说在电网的无功优化过程中,即需要考虑有功网损的降低,也要注重有功网损所对应碳排放量的减小。强化学习在运用过程中,只有单一主体在进行迭代计算,收敛速度偏慢,本文结合强化学习和群智能算法思想,提出了多主体强化学习的粒子群Q(λ)学习算法,通过多个主体的协同寻优,可以获得远快于单主体强化学习的收敛速度。把算法应用于小规模电网碳能复合流无功优化问题,仿真算例验证了计算结果的有效性,为后续多主体强化学习的协同寻优奠定了基础。随着电力系统规模的扩大,控制变量增多,强化学习的普通算法也面临着和其他智能算法相同的局限性——维数灾问题。为了进一步克服“维数灾”问题,本文采用了Q学习解空间降维的方法,将一个大规模Q值矩阵转化成多个小规模Q值矩阵组成的Q值矩阵链,在保持变量内部联系的同时大大减小状态、动作空间,降低了寻优的难度。另外结合帝国主义竞争算法的思想,提出了帝国主义竞争Q学习算法这样一种新颖的多群多主体强化学习算法,通过多个帝国间的竞争和各个帝国内部的协同搜索同化过程,最终获得问题的最优解。文化矩阵的关联记忆特性使得算法可以实现快速寻优,更好地适用于求解大规模电力系统的碳能复合流无功优化问题。仿真算例表明该算法在保留强化学习的优异收敛特性的前提下仍能具备明显的速度优势,为实际电网的在线优化决策提供了理论支持。