基于Q学习的互联电网动态最优CPS控制

来源 :中国电机工程学报 | 被引量 : 0次 | 上传用户:a53825777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
控制性能标准(control performance standard,CPS)下互联电网自动发电控制(automatic generation control,AGC)系统是一个典型的不确定随机系统,应用基于马尔可夫决策过程(Markov decision process,MDP)理论的Q学习算法可有效地实现控制策略的在线学习和动态优化决策。将CPS值作为包含AGC的电力系统"环境"所给的"奖励",依靠Q值函数与CPS控制动作形成的闭环反馈结构进行交互式学习,学习目标为使CPS动作从环境中获得的长期积累奖励值最大。提出一种实用的半监督群体预学习方法,解决了Q学习控制器在预学习试错阶段的系统镇定和快速收敛问题。仿真研究表明,引入基于Q学习的CPS控制可显著增强整个AGC系统的鲁棒性和适应性,有效提高了CPS的考核合格率。
其他文献
<正>习近平同志在中央民族工作会议上的讲话中要求,"要尊重差异、包容多样、通过扩大交往交流交融,创造各民族群众共居、共学、共事、共乐的社会条件,让各民族在中华民族大家
随着金融市场化和金融创新步伐的日益加快,商业银行业务经营结构发生了深刻变化,表外业务的快速发展和丰富为银行多元化经营增添了活力和动力。本文从表外业务概念入手,通过
为了改进立体仓库巷道堆垛机的控制系统性能,设计制作了自动化立体仓库和三自由度单立柱巷道堆垛机实体模型。在此基础上,提出了基于ARM微处理器的立体仓库巷道堆垛机控制方
通过分子克隆技术将pre-miR-449a及其上下游200 bp序列克隆至pcDNA3.0多克隆位点,采用脂质体转染该载体至人宫颈癌Hela细胞中,Real-Time PCR检测载体的表达能力,同时使用荧光
为解决兆瓦级风力发电机组不能频繁偏航和及时响应的矛盾,采用体现能量特征的反时限方法获得相对风向阈值及延时时间。考虑输入信号的稳定性,使用均值对风速和风向进行处理。
目的探讨乳腺癌手术患者住院费用的影响因素,为控制乳腺癌手术患者住院费用提供依据。方法收集广州市某三级甲等医院2013年1月1日-2014年12月31日出院的乳腺癌手术患者的住院
<正> 今年第1辑第42页左栏:“欧洲圣马力诺国,是位于意大利境内的教皇国,全国人口仅一万人。”这里对圣马力诺的介绍,“位于意大利境内”是对的,其余便值得商榷。
介绍山西阳煤丰喜泉稷能源有限公司新建的30 000 m~3/h空分装置的工艺流程、设备配置、开车过程、运行中出现的问题、能耗指标、运行成本等,以使同行充分了解国内此类型空分
<正>湖北省孝感市2010—2011学年度高三第二次统一考试标点符号题A项(实例见后)中问号的用法在老师们中引发了争议,争议的焦点是"还是"前的几个选择项后是使用逗号还是使用问