论文部分内容阅读
电力市场环境下的购销竞价策略是个复杂的动态问题,传统的数学解析方法很难对其进行分析计算,这在中长期交易时间段尤为突出。本文提出以最优潮流(OPF)为基础的双层中长期最优竞价策略学习模型。将外界不确定因素当作该智能体(Agent)的"外部环境"。在所处的环境条件下,Agent通过评价环境作出判断来选择可行的策略方案,通过学习过去的报价经验和对手的行为来指导自身到达最优生产效益的目的。通过在标准IEEE-5节点6支路系统中进行实例计算表明其在适应性和寻优解上的优越性。