分布式机器学习算法在电力SCADA负荷预测中的研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:jackyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电力数据采集与监控系统(Supervisory Control and Data Acquisition,SCADA)是电力系统安全高效运行的重要保障。利用SCADA系统记录的相关数据对电力负荷进行预测,对电力系统的发电控制与电力调度相关的经济效益有重要影响。随着SCADA系统日趋复杂化与网络化的发展,系统中记录的由当前系统的运行状态数据组成的历史运行状态的数据,不仅在量上逐渐扩大,而且随着系统集成度逐渐提高,数据维度也在不断上升。此外,逐渐丰富的负荷相关性信息,例如温度,节假日信息等都逐渐的整合进SCADA系统,都为更精确的负荷预测创造条件,吸引了越来越多的方法和模型在负荷预测领域中的应用实践。为了提高负荷预测的精度与速度,在对SCADA系统数据分析层面的物理架构进行集群化改造的基础上,采用基于Spark分布式计算平台与机器学习算法相结合的方法对电力系统负荷预测进行研究。主要完成了下面几方面的工作:首先,从改善系统的底层设计出发,深入研究了SCADA系统的物理分层,对每一层可以进行的分布式处理进行梳理,在此基础上提出了一种在原有数据中心的基础上整合分布式计算平台的面向网络的SCADA系统架构。不仅保证了原有系统功能的正常运行,也允许新的计算框架部署到SCADA系统中,实现了系统的无级扩展。其次,在构建的混合架构的基础上,以电力负荷预测这个典型的场景为主要的研究对象。对进入SCADA系统的负荷数据,使用基于Spark MLlib的k均值++算法进行聚类,用距离簇中心的距离来发现系统中的异常数据。依据正常数据和聚类中心对异常数据进行修复。从修正后的数据中提取出需要的负荷值,结合从SCADA系统中提取出的负荷相关数据组成特征向量,传递给MLlib中的决策树模型和随机森林模型进行交叉验证,寻找出最优参数模型。最后,为了验证模型的实际效果,采用欧洲智能技术网络(EUNITE)提供的真实负荷数据及其相关数据,基于Spark机器学习流水线(ML Pipeline)构建工作流。结果分析表明,该方法精度上不仅优于传统的泛化神经网络算法,而且优于基于MapReduce的极限学习和支持向量机预测算法。
其他文献
在信用交易中个人信用尤为重要,因此金融个人信用必须有健全的制度作为保障,而这一保障也必须符合社会经济的发展。文章以市场经济体制下的银行信用卡烂账现象为例,在此基础
通过研究中美两国贸易效率和潜力以及贸易非效率的影响因素,旨在进一步提高中美两国贸易效率以及挖掘两国贸易潜力。为此选取了2007~2015年中国与16个主要贸易伙伴国(地区)的
泡沫染色是一种低给液、高节能的染色技术,其成熟发展能改变传统染色方式高能耗,高污染的现状,顺应节能环保的时代潮流。但泡沫染色仍存在染料聚集和染色不深等问题。本文以
汽车工业的快速发展提高了人们的生活水平,改变了人们的出行习惯,同时也加剧了石油能源的消耗以及全球变暖问题。汽车轻量化可以有效地降低车身重量,从而降低油耗,提高能源使
文昌鱼具有独特的进化地位以及形态结构和基因组的简单性,因此是很好的进化发育生物学研究的模式动物。近年来,实验室连续繁育、诱导产卵、显微注射、基因敲除等技术的建立使
小学数学学习,最根本的是学习数学计算能力.因此,培养小学生的数学计算能力是教学的基本任务之一.计算教学直接关系到学生对数学基础知识与基本技能的掌握,关系着学生观察、
本文从邓石如与苏州关系的角度,梳理邓石如在苏州的游历,探寻邓石如在苏州的遗存,从中领略邓石如作为一名布衣书家的风采与余响;从侧面感受清中期以来的书风流变:书坛一改清
本文开门见山地提出了雕塑创作中“因材施雕”这一中国传统审美造型特点。以中国传统石、木雕塑为主要切入点,咀嚼中国古代雕塑中形而上的传统哲学与审美偏好,从中引出充分体
静摩擦是摩擦学研究中一个重要的方面,也是基本的组成部分。静摩擦的研究对于工程实际应用和理论研究都有着非常重要的意义。比如在位置控制、测量、装配和制造领域,当它们的
随着复杂系统科学的不断发展以及社交网络、移动通信网络等现实网络的不断推动作用,复杂网络的研究备受关注。在研究中,学者们发现社区结构存在于复杂网络之中,并且社区结构