论文部分内容阅读
一直以来,需求侧在电力系统中扮演的角色仅仅是价格的被动接收者,在电力系统的供需平衡中,需求侧的主动作用经常被轻视,如何正确引导需求侧参与调度运行是智能电网需要关注的问题。为此,本文搭建电力系统供需互动模型。解决上述问题一般使用集中式方法,该类方法有一定的局限性。经典优化方法虽然求解时间短,但只能求解特定形态的数学模型。而人工智能算法虽然对数学模型的依赖程度较低,但耗费的寻优时间较长,较难实现大规模电网的实时优化需求。为此,本文基于经典的Stackelberg博弈与演化博弈,把供给侧的发电机组与需求侧的负荷聚合商联系起来,搭建了不考虑市场因素的电力系统供需互动Stackelberg博弈模型和考虑市场因素的电力系统供需互动混合博弈模型,并在Q学习的基础上,提出了全新的深度迁移强化学习算法与混合博弈强化学习算法分别用于求解上述两类模型。深度迁移强化学习算法通过对历史优化任务的有效信息进行知识存储,利用深度学习实现高精度的非线性迁移学习,并借助分布式计算优势,可快速获得高质量的最优解。40机54负荷系统和南方某一线城市电网算例仿真表明:深度迁移强化学习算法在保证最优解质量的同时,其求解速度可达其他六种对比算法的419倍以上,适合求解大规模电力系统的供需互动快速决策问题。混合博弈强化学习算法以Q学习为载体,通过引入博弈论和图论的思想,提出分布式算法框架,并把分块协同和演化博弈的方法相结合,充分地利用了博弈者之间互动博弈关系所形成的知识矩阵信息互动,极大地提高了算法的寻优性能,能够高质量地求解考虑复杂网络的多智能体系统非凸优化问题。基于复杂网络理论搭建的四类3机-6负荷系统和南方某一线城市电网的仿真结果表明:混合博弈强化学习算法的寻优性能比大多数集中式的智能算法都好,且在不同网络下均可以保证较好的寻优结果,具有很强的适应性和稳定性。