基于深度强化学习的电动汽车充放电控制及住宅能量管理策略

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhuxu19860802
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为应对气候变化、推动绿色发展,电动汽车(Electric Vehicle,EV)产业在近年来高速发展。尽管拥有巨大的应用潜能,但EV负荷功率大且随机性强,接入住宅配网后会显著提升车网协同环境的复杂度并影响电网的稳定运行。为了推动车网融合发展,有必要对EV充放电进行控制并优化住宅能量管理以降低接入后的不利影响。相比于基于模型驱动的优化算法,基于数据驱动的深度强化学习(Deep Reinforcement Learning,DRL)算法不依赖模型,通过自主学习获得控制策略,对随机性因素适应性强,是解决复杂环境下EV充放电控制以及住宅能量管理的有效途径。因此,本文围绕基于DRL算法的EV充放电控制及住宅能量管理策略展开研究,首先对EV接入的影响进行了定量分析,然后研究对象逐步从单个EV、EV集群扩展到包括EV在内的含多类型负荷住宅集群和含光储的多住宅社区能量交易市场,研究内容如下:(1)针对EV接入住宅后的影响分析,采用先建模后分析的思路,首先基于马尔科夫链设计了EV连续行驶轨迹生成模型。然后考虑用户充电偏好,充电可用性等因素构建了负荷曲线生成模型。算例首先从住宅户均负荷和变压器聚合负荷的角度定量分析,结果表明EV接入后负荷峰值显著增加,变压器过载运行时间明显加长,EV充放电控制具备必要性。算例进而分析了行驶距离以及车辆类型对EV负荷的影响,结果表明EV的可调度时间和可调度容量较高,充放电控制具备可行性。(2)针对单个EV的充放电控制,提出了一种基于DRL算法的控制策略以实现在降低充电成本的同时缓解用户的综合焦虑。首先使用驾驶经验,充电偏好等因素定性描述用户的动态行为,提出了综合焦虑的概念表征用户对续航里程和不确定事件的担忧。然后提拱了相关的数学模型定量分析用户的经验和焦虑。所提算法结合了监督学习与强化学习的优势,并在强化学习阶段采用SAC(Soft Actor-critic)算法以提供连续的充放电决策。仿真结果验证了所提算法良好的在线控制性能。(3)针对EV集群的协调充放电控制,提出了一种基于多智能体深度强化学习(Multi-agent Deep Reinforcement Learning,MADRL)算法的协调控制策略以实现在满足用户能量需求,降低用户充电成本的同时避免配网变压器过载。所提MADRL算法中每个智能体均包含一个集体策略模型估计其他智能体的联合行为和一个独立学习器改善本地控制策略。算法在结构上完全分散,具有良好的扩展性和隐私保护性能。仿真结果表明所提算法能够提供良好的EV集群在线协调控制决策。(4)针对含多类型负荷住宅集群的能量管理,提出了一种基于MADRL算法的能量管理策略,以实现住宅内各类电力负荷的实时控制,并在降低变压器过载现象的同时兼顾变压器容量的分配公平性。为解决多类型负荷连续和离散并存的动作空间,所提方法使用高斯分布和伯努利分布共同设计策略网络,实现了多维多类型控制变量的同时输出;面对可时移负荷的奖励滞后问题,引入奖励重塑机制有效提高了训练稳定性。仿真结果表明所提算法能够有效实现住宅集群的在线协调能量管理。(5)针对含光伏储能的多住宅社区市场能量交易及管理,提出了一种基于层级式深度强化学习(Hierarchy Deep Reinforcement Learning,HDRL)算法的能量交易动态定价及实时能量管理策略,以实现在线生成内部交易电价和住宅集群能量管理决策。在所提HDRL算法中,上层动态定价过程收集各个住宅的能耗信息以及外部电力供应商电价计算社区内的能量交易价格。下层能量管理则仅依赖本地观测量以及内部交易电价制定各电力负荷的控制决策。仿真分析表明所提算法能够适应社区中不同住宅的异质性,同时制定内部电价和能量管理决策。
其他文献
针对宽带相干信号下波达角和极化参数的联合估计问题,提出了一种低复杂度的参数估计方法。该方法首先通过轴向虚拟平移对圆阵接收信号进行平滑,而后对平滑后的自相关矩阵进行聚焦;之后联合聚焦后的自协方差矩阵和平滑后的互协方差矩阵构造极化波达方向矩阵;然后通过该矩阵的特征值和特征向量,经闭合式求解出入射信号的波达角和极化参数。所提算法实现了估计参数的自动配对,无需谱峰搜索计算量小,且仅需三个阵元即可实现参数估
期刊
近年来,量子点以其独特的物理和化学特性受到了学界的广泛关注。传统的量子点制备方法因存在着制备过程繁琐和产物成分复杂等问题而受到一定的局限。作为一种新型的微纳材料制备方法,液相中脉冲激光辐照技术具有独特的选择性加热优势,制备过程简单,产物形貌和尺寸可控,在量子点制备方面有着极大的应用潜力。与此同时,量子点的修饰具有钝化钙钛矿吸光层的作用,有望实现钙钛矿电池光电性能的优化,进一步提升其光电转换效率和稳
学位
大力发展风力发电技术是实现“碳达峰、碳中和”战略的重要途径。目前,我国陆上风电装机量的年增长率趋于平缓,丰富的海上风能资源使得海上风电开发处于大有可为的战略机遇期。为了提升海上风能利用率并简化风力发电机的传动结构,单机大型化与直驱化成为了海上风力发电机的主要发展趋势,促使学术界与工业界持续探索具有高转矩密度、高能量转换效率的直驱风力发电机技术方案。然而,常规单工作磁场谐波电机的转矩密度已趋近上限,
学位
阿霉素(DOX)是一种高效的蒽环类化疗药物,在临床上广泛用于急性白血病、乳腺癌、淋巴癌等癌症的治疗。然而,DOX可呈剂量依赖性引起心力衰竭(Heart failure,HF)。当DOX的累积剂量增加到700 mg/m~2时,心力衰竭的发生率增加到48%。由于这些副作用的存在,尽管DOX具有强大的治疗效果,但其使用受到限制。积极探索DOX所致的发病机制,寻找有效的对抗药物是解决这一副作用的根本措施。
学位
RNA(核糖核酸)是重要的生物大分子,需要折叠成正确的三级(三维)结构(常称为天然结构)来实现其生物学功能。RNA折叠的物理机制是理解其如何实现功能的基础,但目前有许多基本问题仍不清楚。本文利用全原子分子动力学模拟方法研究RNA折叠中的一些基本问题,希望对RNA折叠的物理机制有进一步的认识。主要研究内容和结果有:1)单个碱基配对形成方式:碱基形成配对是RNA折叠的基本步骤,其中一些基本问题还有待解
学位
恐怖袭击作为一种具有政治与意识形态动机、相比普通犯罪更加暴力与极端的突发公共安全事件,对全球各国国土安全造成了极大的影响与危害。尽管各国政府投入了大量人力物力进行反恐工作,但全球恐怖袭击数量与危害仍呈现“越反越恐”的态势,因此对恐怖袭击进行有效防范成为公共安全的关注重点。恐怖袭击风险预测是防范恐怖袭击的关键问题,对于制定前瞻性的反恐策略并采取先发制人的打击措施,进而减轻恐怖主义威胁具有重要意义。在
学位
可见光-热红外(RGB-T)显著目标检测旨在从成对的可见光图像和热红外图像中检测出共同显著的目标或区域,在行人重识别、目标跟踪等计算机视觉领域取得了广泛的应用。近年来,RGB-T显著目标检测取得了更多的进展,大量的方法在多模态、多尺度特征融合方面取得了较好的结果。但是,现在的工作仍然存在如下两个问题:第一,作为一个多模态任务,质量差的模态极易引入冗余噪声,并且导致显著目标边界不清晰;第二,显著目标
学位
示功图是分析、诊断采油井工况与采油设备工作性能的一种有效手段,目前采油井示功图测量技术主要是通过在悬绳器上安装载荷传感器和在游梁中轴承处安装角位移传感器进行有缆在线监测,也称为光杆示功图。随着技术的发展,传统的监测方法已经不再适用,新一代方法更容易安装、更快速,并且更具有可靠性。此外,新的方法能够更好地应对井下的复杂工况,并减少杆管摩擦、液柱载荷、振动载荷等影响。通过改进传统的方法,能够提高量油准
学位
小黑瓢虫(Delphastus catalinae)是粉虱类害虫重要的捕食性天敌。近年来,研究学者做了很多关于小黑瓢虫的生物学和生态学等基础性研究。但是,小黑瓢虫的滞育未被报道,对于滞育的研究可以对未来的人工扩繁打下基础,也有助于深入了解这种天敌昆虫的发育机制和适应机制。在实验室条件下,本文初步探索了光周期与温度在小黑瓢虫滞育过程中的作用,研究滞育小黑瓢虫发生的生物学和生理学的特性变化,并采用Il
学位
目的 分析白虎人参汤加减治疗T2DM及对HDL-C的影响。方法 选取该院2019年9月—2021年9月就诊的60例T2DM患者为研究对象,根据抽签法分为两组,每组30例。对照组接受西药治疗,观察组在对照组基础上接受白虎人参汤治疗,对比两组临床疗效、血糖指标、氧化应激指标、血脂指标、不良反应总发生率。结果 观察组临床总有效率(96.67%)高于对照组(73.33%),差异有统计学意义(P<0.05)
期刊