强化学习性能最优控制框架及其在高压给水加热器运行优化中的应用

来源 :西安交通大学学报 | 被引量 : 0次 | 上传用户:dongsuwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现阶段火电机组运行工况频繁波动的情况,为了解决复杂动态过程难以辨识、控制器设定点无法确定的问题,本文提出了一种基于历史运行数据与强化学习算法的性能最优控制框架。该框架首先在现有控制器的输出上叠加少量随机噪声,然后采用均匀化网格算法构建并维护包含典型工况的数据缓冲区,最后采用基于粒子群优化的连续批量Q学习算法离线求解性能最优控制策略函数。本文以高压给水加热器控制任务为研究对象,得到了一种无需系统辨识也无需确定设定点即可保持变工况控制品质与换热性能的控制器求解方法。为了验证所提框架的通用性,利用某600MW机组高压加热器的仿真模型对水位控制过程进行了分析,结果表明,基于强化学习的性能最优控制框架不需要建立系统模型,可以直接利用历史运行数据求解以累积性能最优为目标的控制策略函数,不仅在动态过程中可以达到较好的控制品质,稳态下也能使系统维持在性能较优的状态,相当于同时实现了设定值优化与设定点跟踪控制。
其他文献
针对我国现阶段农业生产效率低,农业用水浪费严重现象,设计一套基于LSTM神经网络的智能灌溉系统。系统以树莓派为下位机控制器,阿里云服务器为上位机。利用灰色关联分析法确定平均气温、太阳辐射、日照时数、平均风速、相对湿度、气压与作物需水量间的关联度系数分别为0.636 52、0.510 42、0.444 56、0.440 29、0.343 50、0.287 87,从中选取关联系数较大的气象因素作为LS
长短时记忆神经网络(LSTM)由于其在序列数据处理方面的显著优势,因此在无线通信领域得到广泛地应用。本文面向OFDM系统对基于LSTM网络的信道估计方法进行系统地研究与分析。该方法对输入的训练数据进行离线训练,使其学习到信道变化特征,获取信道状态信息预测结果。仿真结果显示,利用LSTM进行信道估计,其估计性能优于传统信道估计方法。
全息高分子纳米复合材料(holographic polymer nanocomposites, HPNC)是基于相干激光聚合诱导相分离原理制备的具有周期性有序结构的高分子纳米复合材料,属于多维度、跨尺度的新概念信息材料.不仅通过微米/亚微米尺度的周期性有序相分离结构存储光波的振幅、相位等全部信息,还通过引入的纳米粒子、液晶、发光分子等存储其他信息,具有信息存储容量大、光调制能力强的特点.在高端防伪
研究了基于TMPTA双单体体系光致聚合物中各个组分的作用,对比了多种双单体体系的光致聚合物材料。结合单体的扩散运动,研究了不同成膜树脂、活性单体和光引发剂对光致聚合物的作用及影响,优化了材料的配比。同时在聚合物薄膜样品中成功记录信息,证明其具有良好的全息记录与高的分辨率性能。测试了不同曝光强度、不同曝光时间、不同温度下材料的衍射效率等全息参量,表明双单体体系在光强10~15 mW/cm2、时间40
随着自然和社会环境的变化,咳嗽发病率明显增高,以咳嗽为主诉的就诊患者在内科门诊中最为常见[1]。以病因类型繁多的慢性咳嗽为例,其患病率在全球普通人群中为9.6%[2],在专科门诊中高达10%~38%[3]。西医咳嗽诊疗指南[4-5]中对咳嗽不同病因类型的诊断方法日趋完善,但涉及检查种类繁多,基层诊疗难以普及推广,部分患者检查后依旧难以明确诊断,各类病因所致的咳嗽在高发病率的同时缺乏有效的诊疗
期刊
随着互联网上服务数目的急剧增多,以及服务属性的多样化,服务计算领域中的服务组合问题变得更加具有挑战性。Web服务组合的目标是有效地组合发布在互联网上的各种服务,构建功能全面的企业应用。服务属性多样化使得组合方法需要同时优化多个目标,服务数目优化以及服务质量(Quality of Service,QoS)感知的服务组合方法已经不能满足这一要求,因此许多学者开始关注多目标Web服务组合问题。大多数现有
随着空天科技的快速发展,人类的深空探测活动日益增多,相较于近地航天探测任务,深空探测任务具有探测器远离地球、通讯时延长、太空环境复杂、测控困难等特点,这些都对观测手段和探测器的导航能力提出了更高的要求,依赖传统的测距、测速等观测手段,通过地面系统对探测器进行导航服务已经难以满足深空探测任务的要求。现有的全球导航星座系统GNSS由于其本身设计特点,并不适合对深空探测器任务提供导航服务,且现有的导航星
小学生还处于人生的幼年期,个体意识正在慢慢苏醒,这时候正确观念的引导和教育就显得尤为重要。培养小学生的集体观念,有利于其团队意识的形成,还能培养其责任意识和大局观,这能够对小学生的未来人生产生很重要的作用。利用小学体育可以促进小学生集体观念的形成。下面从小学生集体观念淡薄的原因出发简述利用小学体育教学来培养小学生集体观念的各项策略。
期刊
针对当前立体全景视频传输缺少有效的流自适应方法,且传统全景视频流自适应策略传输双目立体全景视频使得传输数据加倍,所需带宽巨大的问题,该文提出一种基于多智能体强化学习的立体全景视频非对称传输自适应流方法,以实时应对网络带宽波动。首先,根据人眼对视频显著性区域的偏爱,左右视点中每个瓦片(tile)对立体视频的感知质量的贡献度不同,提出一个基于tiles的左右视点观看概率预测方法。其次,设计了一种基于策
背景:髋关节置换不但改善了股骨颈骨折患者的生活质量、下肢功能,还降低了死亡率,但因术后康复手法单一、康复医师分配不均,总体人群疗效不明,因此康复机器人运用于髋关节置换后不失为一种更有效及安全的方式。目的:研究基于平衡障碍康复机器人多场景康复模式对全髋关节置换后老年人下肢功能的影响。方法:招募中国人民解放军军区总医院及成都大学附属医院骨科病区,2021年1-6月收治的60岁以上股骨颈骨折行全髋关节置