基于预测深度强化学习的家庭能源管理系统研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:ilbgsm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
能源和环境问题是人类进步和社会发展过程中始终面临的棘手问题。为解决这两大问题,塑造一个低碳能源的未来,整个能源系统一直在努力寻找更多智能和绿色的选择。作为电网的终端用户,家庭能源对电力的消耗约占电力市场的60%。世界各国相继提出需求响应(Demand response,DR)策略,促使用户积极主动参与家庭能源管理系统(Home energy management system,HEMS)的优化和调度。然而,家庭用户行为的不确定性、用电设备类型的多样性以及各种设备工作状态的复杂性给家庭能源管理带来了严峻的挑战。为了实时智能优化调度家庭用户的用电设备,本文在数据驱动框架下提出一种基于预测的深度强化学习家庭能源管理系统调度方法。主要研究工作如下:1.在家庭能源管理系统中,考虑到室外环境温度的未来变化信息对用户满意度产生的影响,本文提出对室外环境的温度建立预测模型。针对室外环境温度呈现非线性和非高斯的特点,本文提出一种基于广义互熵长短期记忆(Generalized corr-entropy assisted long short-term memory,GC-LSTM)神经网络的温度预测方法。该方法结合LSTM神经网络的学习记忆能力和GC处理非高斯数据鲁棒性强的特点,建立精确的温度预测模型预测未来环境温度的变化趋势。通过与其它同类算法对比,证明所提出的方法具有更高的预测精度和更强的鲁棒性。2.将上述GC-LSTM温度预测模型与模型自由的竞争性-双深度网络(Duelingdouble deep Q-Network,Dueling-DDQN)算法相结合,对包含光伏发电、储能系统和电动车等在内的家庭用电设备进行智能优化调度。根据家庭环境的实时变化信息,以数据驱动的方式对家庭能源管理系统进行离线训练和在线测试。在训练过程中通过将每个用电设备的动作与奖励相结合,使智能体快速学习到一个满意的动作,同时提高算法的收敛速度。通过实验仿真、算例分析和不同基准对比验证所提出方法在家庭能源管理系统中的实用性和有效性。3.针对家庭能源管理系统的大功率用电设备—供热通风与空气调节系统(Heating,Ventilation,Air-conditioning and Cooling,HVAC)的节能问题,进一步提出采用基于多步预测深度强化学习(Multi-Step Predictive Deep Reinforcement Learning,MSP-DRL)算法框架的HVAC智能优化管理系统。在智能电网实时电价的机制下,使用带有未来预测温度信息的深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法,以达到在对HVAC系统进行控制时,能同时做到有效减少耗电成本和保证用户的满意度的目的。
其他文献
近年来,医院信息系统建设发展迅速,传统的系统间“点对点”接口交互模式日益不能满足医院业务数据共享需求,传统信息化模式的弊端突显。国内越来越多的医院正加速实施基于集成平台的整体建设,对业务系统接口进行标准化改造接入平台,搭建平台数据中心整合数据,实现真正的互联互通。然而,集成平台建设项目具有关联系统多、需求范围广、开发周期长、技术难度大等特点,如何保证项目的质量,克服项目延期、成本超支、需求难以满足
学位
随着计算机、智能终端和互联网技术的发展,餐饮行业出现了重大变革,由传统的线下模式发展到“互联网+”模式,人们在网络上获取餐饮信息的手段变得多种多样。但是,餐饮行业的“互联网+”模式造成了餐饮行业的数据规模出现了指数增长的趋势,餐饮行业的信息过载不仅给用户带来筛选有效信息的难题,也成为了餐饮行业发展的绊脚石。同时,传统推荐算法也存在没有考虑信息价值随时间衰减和事物关联性随距离增加而衰减的问题。本文就
学位
随着工业化的进一步升级,优化节能控制在工业生产中占据越来越重要的位置。相较于传统的粗犷生产方式,优化节能控制能够为企业带来更少的消耗与更多的效益,国家和企业已经逐渐投入更多的资源,推广优化节能控制的应用。能效模型,控制模型和优化控制方案是节能优化控制的重中之重。水泥行业的各主要设备单元迫切需要适合自身的优化节能控制方案。论文选择某水泥生产线的窑头篦冷机冷却风机群为研究对象,该装置目前依然以手动控制
学位
电气控制柜生产的传统方式已渐渐无法适应新时代的要求,电气控制柜精细化,复杂化,高密度化的发展方向使得人工线缆装配低效率的缺陷越来越突出,尤其是线缆使用纯手工装配不仅会消耗大量的时间也导致了生产产品一致性差的问题。电气控制柜线缆装配工作进行自动化升级对于提升控制柜制造工艺水平有着重要意义。作为电气控制柜线缆自动装配设备的核心部分,负责运行过程中对实际环境进行检测并反馈,视觉系统的研究成为设备研制过程
学位
种子乳液聚合是制备聚氯乙烯(PVC)糊树脂的主要方法之一,聚合釜是氯乙烯(VC)种子乳液聚合的核心设备,其特性直接决定了PVC糊树脂的时空产率、质量及生产成本等。我国VC种子乳液聚合技术多为20世纪80~90年代国外引进,几十年来技术进步较小,存在反应釜体积偏小、聚合时间过长、生产效率偏低等不足。另外,国内对VC种子乳液聚合动力学、乳胶粒子粒径控制等基础研究偏少,制约工艺技术的改进和大型聚合釜在V
学位
内部财务管理平台是将企业内部资源进行有效整合,从而提升运营能力和财务管理水平的信息化平台,是企业基于行业和自身特点,对以用友软件和金蝶软件为主的财务软件的完善和补充,是企业个性化建设的信息化平台。内部财务管理平台的建设是将信息技术与企业运营和财务管理进行全面结合的过程,通过信息化技术的融合使用,可以有效提高企业的管理效率,保证企业长期稳定发展,是企业信息化建设的重要组成部分。绝大多数设计类公司由于
学位
物体识别和位姿估计是计算机视觉领域比较重要的任务,对自动驾驶、智慧医疗等应用场景有着特殊意义。当前物体识别算法大多数基于颜色图像RGB,在车道线检测等场景有较好的表现。但在弱纹理、低光照条件下,算法性能有较大下降。此外,为追求高准确率,现阶段的物体识别和位姿估计算法变得复杂。其参数量和计算量随着性能的提升成倍增加,算法效率偏低。为解决上述问题,本文从提高算法性能和效率、降低模型复杂度出发,基于多模
学位
随着高铁成为人民日常出行的重要工具,铁路枢纽广场作为铁路交通硬性配套也在城市更新中不断提升,但在当下财政面临经济增速放缓的背景下,需求和供给矛盾突出。PPP模式发挥其政企合作、利益共享和风险共担的优势,在国内已有上万个项目采用该模式。但是公共资源是有限的,如何最大发挥其效益,判断项目是否可采用PPP模式,各国政府通常采用物有所值评价方法。我国物有所值评价存在着数据积累不足、成熟数据库缺失等困境,虽
学位
随着社会经济的发展,各领域对安防预警的需求提高,周界安防作为最前端防线,对于阻挡、发现入侵至关重要,而现有安防系统大多使用电子类传感器,存在易受电磁干扰、无法在易燃易爆的特殊场合使用的问题,对于入侵事件无法智能识别,误报率有待降低。因此,本文基于光纤传感技术,设计了一种智能光纤围栏周界安防系统,能够以光纤围栏的形式监测安防区域,并通过支持向量机算法判断入侵事件,在无人值守变电站、电气危险场所等场合
学位
在氢能产业助力实现“碳达峰、碳中和”目标的过程中,质子交换膜燃料电池凭借其自身所具有的零碳排放、能量转换效率高、系统可靠性高等优点,受到了广泛的研究和应用。质子交换膜燃料电池的模型对于研究其性能具有重要指导意义,同时工作温度作为影响燃料电池输出性能和耐久性的关键参数,需要设计合理的温度控制算法,保证燃料电池的高效和稳定工作。本文利用机理建模和经验建模结合的方法,建立了质子交换膜燃料电池的集总参数模
学位