基于强化学习的暖通空调系统节能控制方法

来源 :苏州科技大学 | 被引量 : 0次 | 上传用户:hezhimou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在世界范围内,社会总能耗的40%来自建筑行业。在国内,建筑行业的能耗接近社会总能耗的20.6%。同时,建筑行业中超过50%的能耗来自暖通空调系统(Heating Ventilation and Air Conditioning,HVAC)。因此,针对HVAC开发和实施有效的节能控制技术对社会节能减排来说至关重要。目前,针对HVAC节能控制的方法主要分为基于模型的控制方法以及基于无模型的控制方法。基于模型的控制方法得到学者广泛的研究与验证,但该方法高度依赖准确的仿真模型。相比之下,基于无模型的控制方法无需大量的历史数据构建准确的仿真模型。基于无模型的控制方法主要分为基于规则的控制方法以及基于强化学习的控制方法。基于规则的控制方法往往是静态的,其控制规则的制定依赖工程师或者设备管理员的经验而强化学习控制方法不依赖工程师的经验并能进行自适应学习。因此,对于缺乏历史数据的旧建筑的而言,基于强化学习的控制方法更具有研究价值。本文围绕如何使用强化学习算法对缺乏设备运行历史数据以及设备性能模型的HVAC优化控制方法进行研究。基于实际案例系统的能耗分析,本文构建HVAC灰盒仿真平台,并利用强化学习算法对案例系统中不同型号冷机间系统冷负荷分配方式、冷却水泵频率以及冷却塔风机频率进行组合优化控制。主要的内容包括以下三部分:(1)针对实际案例系统缺乏设备运行历史数据以及设备性能模型的问题,构建出一套灰盒仿真平台。由于案例系统缺乏设备运行历史数据,因此无法通过数据驱动的方式回归出设备性能模型。该灰盒仿真平台通过将案例系统设备铭牌中的信息融入到Energy Plus中标准的设备模型,构建出冷机、冷却塔以及冷却水泵等设备的灰盒模型,然后按照案例系统的布局信息设计出各个设备的组合方式。该组合方式通过循环迭代处理冷却水出温度和冷却水回水温度的耦合关系。结果表明,灰盒仿真平台设计合理,可以作为强化学习算法预训练和实验的平台。(2)针对基于模型控制方法的性能高度依赖仿真平台准确性的问题,提出基于基于DQN的单智能体控制方法。该方法通过灰盒仿真平台预训练之后部署到实际系统中并进行自适应学习,而不要求仿真平台具有高度的准确性。在实际部署中,因训练样本分布不均衡以及组合优化多个控制点形成了大规模的动作空间等问题,导致基于DQN的单智能体控制方法策略学习较慢。针对该问题,本文在基于DQN的单智能体控制方法的基础上提出基于双池DQN的单智能体控制方法。该方法设计两个经验池分别存储不同类型的训练样本并按照特定比例选取样本进行训练。此外,该算法对行为策略进行优化,通过分类法压缩动作的选择空间。仿真结果表明,基于双池DQN的控制算法在策略学习速度方面有着显著的提升。(3)为进一步提升基于单智能体强化学习算法策略优化的速度,提出基于合作型多智能体深度强化学习控制方法。该方法建立多个子Agent分别优化每一个节点,将基于单智能体深度强化学习算法排列组合形成的动作空间压缩成多个Agent线性组合的联合动作空间,极大地缩小了动作空间。Agent之间通过共享奖赏以降低系统总能耗。但基于合作型多智能体受到环境非稳态性的影响,导致前期值函数估计不准确。针对该问题,在合作型多智能体深度强化学习算法的基础上提出一种管道通信机制。该机制对所有Agent进行优先级划分并通过管道传递Agent之间的决策信息,以降低环境非稳态性的影响。仿真结果表明,基于管道通信的多智能体深度强化学习算法在算法训练前期拥有更出色的控制效果。
其他文献
姿势迁移的图像生成技术旨在将给定的源人物姿势转换为设定的目标姿势,同时,保持生成人物图像的外观及服装纹理与源人物的尽可能一致。人物姿势的表示是姿势迁移研究中的核心问题。目前使用较为广泛的是基于人体关键点的二维姿势表示,该方式的优点在于获取方便,可通过已经成熟的姿势估计算法直接通过对源人物图像计算得到准确的姿势关键点。其他方法如基于3D表示的人物姿势由于获取困难,使其应用场景十分受限。然而,使用二维
学位
时间序列是按时间刻度有序并且互相关联的数据序列,数据特征随时间具有一定的变化规律。时间序列预测已经在商业、环境、医学、工业等各个领域得到了广泛的关注。实现准确的预测对节约资源、提高效率、减少成本、优化配置等方面都具有重要的作用。时间序列预测方法是根据历史的时间序列数据、相关特征等推算未来观测值的手段。目前时间序列数据预测的方法以深度学习模型为主,虽然取得了很多研究成果,但是在时间序列数据的预处理、
学位
是自然语言处理领域中一个重要的任务。随着深度学习技术的发展,相比于短文本摘要技术,长文本摘要发展缓慢。一方面缺乏可用的大规模数据集;另一方面,当文本序列过长时会产生长距离依赖问题。针对上述问题,本文基于深度神经网络技术,开展长文本摘要建模方法研究。本文从以下四个方面对长文本自动摘要任务展开研究:(1)针对当前中文长文本数据集缺乏的问题,本文采用中文专利数据构建了一个大型的专利数据集。该数据集在关键
学位
随着新一代信息技术、大数据理论与实践的高速发展,智慧城市的范围不断扩大、范畴不断延伸、智能化的水平不断提高。智慧城市建设中地址的数字化、精细化、智能化管理成为各种政务管理、金融机构、市场应用重要基础数据,也是实现应用目标、提升应用能力的必要数据。但是,由于我国地址规划建设起步相对较晚,传统建筑地址采集方式落后且缺少统一的规范策略,造成各行各业既有的建筑地址信息数据难以准确匹配,难以给上层的地理信息
学位
长期以来,建筑工程中安全事故频繁发生所导致的人员伤亡和财产损失,受到国家和社会的广泛关注。为了防止类似事故的发生,在每次事故发生后会形成事故调查报告,通过从历史事故中总结经验教训,从而制定安全管理策略和防范措施用于预防未来的风险发生。而以往对事故的分析研究依赖于专家利用专业知识进行人工分析,这使得分析结果很容易受到人的主观影响。同时,随着事故报告数据量的不断增加,人工分析耗时耗力,已经无法满足需求
学位
目的 通过对安徽省某县级医院胆囊炎单病种付费患者住院费用的灰色关联分析,为该院有效缩短住院时间、适应支付方式改革提供对策建议。方法 收集安徽省某县级医院2016年至2019年单病种付费住院信息,分析胆囊炎患者住院数据,对住院费用结构、关联系数、关联度等进行分析。结果 该院胆囊炎患者手术麻醉费、药品费占比及关联系数较大,与次均住院费用关联度也最大,护理费构成比有小幅度上升。结论 手术麻醉费与药品费对
期刊
文本生成序列图像是一项融合计算机视觉和自然语言处理两个方向的跨模态任务,该任务通过输入的文本描述,生成符合对应语义信息的序列图像。由于文本描述能够生成多个不同的图像,因此生成语义一致且分辨率较高的图像是一个极具挑战性的任务。生成对抗网络由于自身独特的对抗机制,被广泛应用于解决文本生成图像的任务。然而生成对抗网络的模型训练难以收敛,文本生成序列图像仍然面临着生成图像的对象布局混乱、上下文信息难以提取
学位
无线传感器网络(wireless sensor network,WSN)技术的快速发展,使得其在智慧建筑中的监测应用越来越广泛,使用WSN在智慧建筑中进行监测时,传感器节点可能因为能量长时间消耗或物理损坏等原因失去原有效用,节点通信链路也可能会因为物体阻挡或数据碰撞堵塞等原因出现暂时或永久性的通信故障。因此研究网络能量低功耗与故障容错,是实现整个网络正常运行的关键问题。针对WSN内节点能量消耗过多
学位
随着人工智能、物联网和大数据技术的发展,车辆队列已成为智慧城市建设的重要推力。而智慧建筑作为智慧城市的重要组成部分,也给车辆队列的发展带来新的机遇。一方面车辆队列为解决建筑群间车辆的行驶安全、交通堵塞和资源浪费的问题做出了巨大的贡献;另一方面轮船码头的物流车辆队列也提升了港口企业整体的运营效率。在全球疫情肆虐的背景下,为减少人员间不必要的接触,提高建筑室内任务的工作效率,车辆队列为AGV仓储研究提
学位
近年来,随着人口增长和经济发展,建筑行业能耗逐年增加。过多的建筑能耗不仅加剧了能源短缺情况,还排放了大量的二氧化碳,严重阻碍国家“双碳”目标的实现。因此,建筑节能至关重要。建筑能耗预测作为建筑节能的基础,在获取控制设备的最优策略、规划能源调度及评估建筑系统运行方面起着不可替代的作用。深度强化学习(Deep Reinforcement Learning,DRL)将深度学习(Deep Learning
学位