【摘 要】
:
电力作为国民经济的生命线,其安全必须得到保障。然而近年来随着社会经济的蓬勃发展以及用电负荷的与日俱增,窃电、欺诈、民电商用等用电异常行为愈加引人注目,并且逐渐呈现出多元化和产业化趋势。这不但损害了电网企业的利益,同时也影响了供电秩序,甚至威胁电网安全。目前解决这一问题的方法多为定期巡检和人工筛查等,运营成本高且效率低,造成了大量资源的浪费。而利用机器学习进行用电异常识别,效率和精度都更高,显著降低
【基金项目】
:
国家重点研发计划智能机器人专项子课题(2019YFB1312102); 河北省自然科学基金(F2019202364);
论文部分内容阅读
电力作为国民经济的生命线,其安全必须得到保障。然而近年来随着社会经济的蓬勃发展以及用电负荷的与日俱增,窃电、欺诈、民电商用等用电异常行为愈加引人注目,并且逐渐呈现出多元化和产业化趋势。这不但损害了电网企业的利益,同时也影响了供电秩序,甚至威胁电网安全。目前解决这一问题的方法多为定期巡检和人工筛查等,运营成本高且效率低,造成了大量资源的浪费。而利用机器学习进行用电异常识别,效率和精度都更高,显著降低了人力和物力成本,对于维护电力系统的安全稳定具有重要意义。本文基于机器学习开展对用电异常识别研究,主要研究内容如下:(1)基于混合采样的不平衡数据用电异常识别电力负荷数据具有数据量大,且异常样本少的特点。正负样本比例不平衡会使学习模型偏向于具有大量样本的正常类别。在异常识别中,学习模型却需要更加关注少量的异常样本,这会导致模型产生偏差,使识别效果变差。针对不平衡数据,本文基于极限梯度提升(e Xtreme Gradient Boosting,XGBoost)模型,提出了结合边界过采样模型(Borderline-SMOTE,BSMOTE)以及局部异常因子(Local Outlier Factor,LOF)的不平衡数据用电异常识别模型。首先利用一维卷积自编码器(One-Dimensional Convolutional Autoencoder,1DCAE)对数据进行特征提取,之后利用BSMOTE对少数的异常样本进行过采样,利用LOF对多数的正常样本进行欠采样,最后利用XGBoost模型对混合数据进行训练,根据异常识别结果对数据混合参数α进行调整,进行迭代优化,得到最终的用电异常识别模型。本模型的AUC(Area Under Curve)指标达到了0.9656,F1分数(F1-score)达到了0.9559,相比1DCAE-BSMOTE-XGBoost等模型,表现出更好的异常识别效果。(2)基于Mix Match的半监督用电异常识别电力负荷数据普遍缺少标注,获得大量标注数据并不现实,因此仅利用少量监督数据的半监督学习更适合这一场景。同时,传统机器学习的精度在某些情况下并不尽如人意,而深度学习模型则展现了更高的识别准确率。针对标注数据少以及识别精度低等问题,本文提出了一种基于Mix Match的半监督异常识别模型,首先利用格拉米角场(Gramian Angular Field,GAFs)将一维时序数据转化为二维图像数据,再利用WGAN(Wasserstein Generative Adversarial Networks)模型对这些图像进行不平衡数据处理。最后输入Mix Match半监督异常识别模型进行训练,实现用电异常识别。本模型的AUC指标达到了0.9023,F1-score达到了0.8912,相比GAFs-WGAN-∏model等模型,有着更高的异常识别精度。(3)基于混合深度嵌入聚类的用电异常行为分类由于用电异常行为具有多样性,而对应解决措施也各不相同,对用电异常行为进行分类,并依据分类结果进行处理,可以有效提高电力部门解决问题的效率。针对传统机器学习在用电异常数据聚类上效果的不足,本文提出了一种混合深度嵌入聚类模型。首先利用1DCAE以及一维变分自编码器(One-Dimensional Variational Autoencoder,1DVAE)对数据分别进行数据降维,并进行特征融合,获取深度特征。再利用K均值聚类模型(K-means)获取聚类中心。最后将数据传入聚类层,根据重构损失和聚类损失迭代更新聚类结果,实现用电异常数据的无监督聚类。本模型的分类适确性指标(Davies-Bouldin Index,DBI)指标达到了0.14,聚类内部评价指标(Calinski Harabaz Score,CH)达到了16071.79,轮廓系数(Silhouette Score,SC)达到了0.90。相比DCEC等模型展现了更高的聚类质量,同时验证了深度嵌入聚类在解决电力数据分类问题上的可行性。
其他文献
在知识经济时代背景下,以互联网为核心的大批企业迅速崛起。互联网企业与传统企业有着本质的区别,其摆脱了土地、机器设备以及大规模生产车间的限制,转而使用商誉、互联网技术以及其他无形资产来推动自身的发展。这种轻资产的经营模式使得企业之间的竞争越来越激烈,并且竞争的方式也在发生着变化,不再是传统的有形资产的直接竞争,而是变成了各企业之间的无形资产的竞争。全国企业甚至全世界的企业对于无形资产重要性这一点已经
超现实主义是西方艺术中重要的流派之一,涉及的领域深广,其中包括了文学和美术等。其产生于世界第一次大战,盛行于一战和二战期间,这一艺术思潮不仅在当时影响甚大,即使是在当代艺术创作中依然具有现实意义。本文的研究主要从以下四个方面展开:第一章对超现实主义产生的历史背景进行简述,紧接着论述马克思恩斯特生平和社会交往。第二章分析总结马克斯恩斯特绘画技法,主要从拼贴,拓印,刮削,模印等角度方面书写。第三章论述
文物作为历史的承载者,反映的是某个历史时期的社会活动和经济基础,对人类理清文明发展脉络、了解历史具有至关重要的作用。由于自然和人为等原因,很多文物正在遭受破坏甚至消失,文物保护工作已刻不容缓。传统的文物修复方式不仅修复速度慢、成本高而且易造成二次损伤。因此,利用新兴技术对破损文物进行修复已迫在眉睫,特别是利用深度学习方法对文物三维点云模型进行补全处理。为了提高点云补全质量,减少噪声和异常值的影响,
宋元明清时期疫灾多有发生,各类史书和医学典籍中记录了疫灾发生、危害及防疫抗疫的政策措施,是研究本时期疫灾书写特征及历史传承关系的基本文献。医学典籍不仅记载了中医的发展历程,也保留了历代人民与疫病斗争的经验,经历了数量上由少到多,形式上由简到繁,内容上由综合到专科的发展过程。总体来看,宋元明清时期疫灾书写的方式与内容随人类对瘟疫认识的深化而不断拓展。本文从灾害史的角度探讨了宋元明清时期医学典籍中的疫
新中国成立后,在党和政府的关心扶持下,中国漆画得到发展,从开始萌芽期、探索期、成长期发展到现在,取得了可喜的成绩。20世纪后期,漆画在中国现代美术史中具有特殊的地位,在各位漆艺前辈们的不懈努力下,1984年第六届全国美术作品展首次将漆画作为独立画种纳入展览,从此中国漆画迎来了崭新的篇章。陕西漆画起步较晚,发展缓慢,起起伏伏。曾有过80年代的短期繁荣,也经历过90年代后期的低潮。1985年由西安美术
盐、煤作为国家的战略物资,对国家的发展、安全有着十分重要的战略地位。民国时期,云南因战乱频繁、盐务混乱和煎盐成本上升等因素的影响,导致盐价上升,出现“斗米斤盐”的现象,严重影响群众日常生活和地方税收。提高盐生产技术、降低盐价,缓解云南盐荒成为迫在眉睫之事。在这样的背景下,一平浪盐煤厂应运而生。从1933年开始筹建到1950年被云南军事委员管理会接管前,其名称、组织结构、运营范围多次发生变化,但不变
本研究从迁移理论和言语学习模型出发,提出研究假设,即通过迁移理论提出“有声调母语者比无声调母语者汉语声调产出更好”的假设;通过言语学习模型提出“无声调母语者比有声调母语者汉语声调产出更好”的假设。为了验证所提出的两条假设,本研究采用实验语音学方法,通过考察12名孟加拉国学习者和12名泰国学习者汉语单字和双字声调的声学产出,同时以8位汉语母语者的产出结果作为对照,探究母语声调经验和汉语水平对汉语学习
随着大数据时代的到来,用户(个人或企业)拥有的数据急剧增长.由于本地存储资源是有限的,用户只能将数据外包给云平台,然而外包数据的隐私性和可搜索性是阻碍云存储健康发展最关键的问题.近年来,学术界和工业界针对上述问题进行了大量研究.本文主要针对云存储中外包数据的隐私保护和高效搜索这两方面进行研究.具体围绕以下两个研究内容:对一些可搜索加密方案中使用的0/1-编码技术进行深入研究,并给出该技术的使用建议
十八大提出要“以人为核心”发展新型城镇化,首要内容是有序推进农业转移人口市民化。山东省作为农业人口大省,随着城镇化的不断提速发展,大量的农业转移人口进城。但由于城乡二元结构、城市承载力等限制,致使农业转移人口不能公平地得到发展,不能与城市居民享受相同的社会保障和公共服务等,同时农村原有的各项权益如何得到保障等一系列的问题也逐渐凸显,这将对市民化进程的推进以及城镇化高质量发展造成阻碍。如何把握好山东
王玉平曾是“新生代”绘画群体的重要代表,以主观的造型夸张和独有的色彩运用建立了鲜明的个人风格。他的作品老辣随性,质朴内敛,简明的语言涉笔成趣,他以一种“市井浮世绘”的手法诉说着平凡生活的柔软和美好。每次伫立于他的画作之前让笔者深深的体会到了绘画的深邃吸引力。寥寥数笔,耐人寻味。为了更好的完成自己的毕业创作,提升自己的绘画水准,笔者对王玉平绘画的绘画语言进行了分析。文章整体从绘画语言元素研究出发,首