基于大数据的异常用电行为检测算法及应用

来源 :福州大学 | 被引量 : 0次 | 上传用户:huandakedi222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着智能电网的快速建设与发展,异常用电行为日渐猖獗,严重影响了电网系统的运行和供电企业的效益。研究一种新的异常用电行为检测方法不仅可以为电力公司提供重要的决策支持,而且在保障居民用电安全和维护电力市场正常运转上发挥了重要作用。同时,面对智能终端累积的海量用户用电信息,实现基于大数据平台的异常检测分析也是未来电力大数据发展的必然趋势。传统的单一异常检测方法对于具有随机性和不平衡性的海量用电数据分析存在效率低下的问题。本文针对该问题,以用电数据为基础,分析了用户在用电行为习惯上表现的不同特征,结合分类预测算法、不平衡数据处理技术,提出基于随机森林算法的不平衡数据分类。同时为应对海量数据所带来的指数级计算量增长问题,研究了基于大数据平台下异常用电行为检测算法的实现,大大缩短了预测算法的运行时间。本文所取得主要成果如下:(1)构建基于用户分类的异常用电行为分类预测模型。首先分析了用电数据集,对用电数据进行预处理,提取用电行为特征;其次,建立分类预测模型,并比较单分类器和集成学习方法在该模型上对异常用户的分类效果。实验结果表明随机森林算法在该分类预测模型上的分类性能优于决策树、朴素贝叶斯和KNN等传统分类算法。(2)提出基于随机森林的不平衡数据分类算法在异常用电行为检测上的应用。首先分析影响分类器性能的几大因素,针对本文所采用的用电数据集在类别分布不平衡的特点,提出基于不平衡分类的异常用电行为检测算法。实验对用电数据进行平衡化处理,重新提取用电特征,训练分类模型等,对比了基于数据处理和基于集成算法的几种不同不平衡分类方法在该分类预测模型上的分类效果。实验结果表明基于不平衡集成的随机森林算法在该用电数据集上分类性能最佳。(3)实现Spark平台上的异常用电行为检测算法及应用。构建基于大数据平台的分类预测模型,运用分布式计算框架,设计并实现基于不平衡分类的随机森林算法。对比了基于单机运行和Spark平台上的实现的几种算法平均运行时间,实验结果表明,在不影响算法分类性能的情况下,在Spark平台上实现的检测算法平均运行速度比单机版的提高了约20倍。基于大数据平台处理海量用电数据提升了异常用电行为检测算法的运行速度,缩短了异常检测时间。
其他文献
介绍了往复式压缩机管道振动分析中时域法和频域法的计算原理,分析了两种方法的优缺点。最后结合实例对两种方法计算结果进行对比,分析两种方法的适用范围以及计算中需要注意
本文介绍了由增强型闪存单片机PIC18FXX2及数码语音芯片ISD25120组成的微电脑语音系统。设计出了系统的相关硬件电路,给出了录、放音实用的程序流程图。
<正>目的:评估疗效差的远视性弱视儿童的心理状态,对比观察分析综合疗法联合注意力训练对依从性差弱视儿童治疗的临床意义。方法:采用Achenbach儿童行为量表家长用表和Conner
会议
<正>朱德一生爱兰花。朱德喜爱兰花,不仅因为兰花正气凛然,幽香清远,而且还寄托着他对前妻与战友伍若兰的无尽情思。1929年2月初,伍若兰随红军大队转战江西项山。一天夜间部
期刊
<正>本刊讯:国家质检总局于9月15日~16日在重庆召开了"全国特种设备安全监察工作座谈会"。特种设备安全监察局局长宋继红在会上做了《继承发展真抓实干努力推动特种设备质量
分析了目前我国高校会计教育的课程体系现状,以及这种体系所培养出来的学生与社会对会计人员所应具备的知识和技能结构之间的差距,借鉴国外课程体系改革的先进经验,结合国内国际
与两电平逆变器相比,多电平逆变器具有输出更近似于正弦波、谐波含量小、对功率开关器件耐压等级要求低、开关频率较低等特点,非常适合应用于高压大容量变频调速领域。直接转
阐述了目前城市污水再生利用的主要方向,并结合安庆市新城东区的特征提出了具体的方向性规划,对我国沿江丰水区的污水再生利用问题提出了参考性意见。
文章基于新地理经济学模型,引入金融发展变量,分析了金融发展与产业空间区位之间的联系,通过模型推导和数值模拟方法,发现随着金融市场的发展,一方面那些受到的融资约束的中小企业
《华尔街日报》中文网络版(The Wall Street Journal Chinese Online Edition)是道琼斯公司旗下的唯一在线中文财经出版物,本文将随机选取10篇标题中有"中国"和有"美国"的各1