论文部分内容阅读
随着科技的发展进步与电力体制的改革,人们的用电需求呈不断上升的趋势。同时,互联网行业的兴起以及社会经济的发展,也对电力消耗的持续增长提供了有力的支撑.近年来,大规模的窃电事件时有发生,并且其态势已经从最初的直接粗暴发展为设备智能化、手段专业化、行为隐蔽化、实施规模化的高科技窃电。窃电行为的发生,不仅给电力公司及合法用户带来巨额的经济损失,更对电网造成了不同程度的破坏。在智能电网的建设过程当中,如何对潜在的异常数据进行及时准确的检测,有效地甄别窃电行为,是保障电网安全性和高可靠性的关键。对于上述背景,本文的研究工作主要围绕以下几个方面展开:1.本文首先对当下智能电网的数据流程及存在的窃电现象进行总结,并对近年来国内外关于窃电检测的研究进展进行了梳理。基于各种方法的比较,结合真实的电网异常用电数据集,将全体电力用户划分为长时间跨度用户和短时间跨度两类,并制定合理的数据预处理和特征提取流程,最终生成与类别标签具有较强关联性的特征集合.2.对于存在长时间跨度用电记录的检测对象,本文根据此类用户最近两年的用电行为特征,采用基于XGBoost、Random Forest和Logistics Regression的混合算法,综合考量三个分类模型的预测结果,对用户的用电行为正常与否给出最终判断。此混合模型的出发点在于,不同的子模型对于不同数据的敏感程度及处理能力各有所长,通过结合每一个子模型的判别结果,得到一个较为全面的综合模型。经过实验验证及最近同类研究对比,这一混合检测模型在各评价指标上的表现均十分优秀,能够较好地完成此类用户异常与否的甄别任务。3.针对仅存在较短时间跨度用电记录的检测对象(开户时间较近的对象),选取此类用户当月的用电记录生成的特征,在One-Class SVM的异常点划分基础上,根据Local Outlier Factor的密度衡量及LSTM预测的正常用户用电均值对One-Class SVM结果中被错判的正常用户进行修正调整.目前,关于短时间跨度的用电数据异常检测研究相对缺乏,本文的设计方案具备一定的创新性与合理性。经过实际数据的检验,这一策略在保留One-Class SVM高召回率特点的同时,也使整体判断的准确率有较为明显的提升。4.在整个模型的训练过程中,对于参数较复杂的算法子模块,本文采用贝叶斯优化的方法,获取该模块在训练数据下的超参数。这一过程相比于传统的随机搜索、网格搜索,在迭代过程中参考之前的参数信息,不断地更新先验,迭代次数相对较少,针对非凸问题依然有良好的效果。通过实验验证,贝叶斯优化既将计算耗时限定在合理的范围内,同时保证了最终所得超参数的质量。本文所设计的基于机器学习混合模型的用电数据异常检测方案,能够基于电力用户的统计数据进行科学准确的判断分类,为降低供电企业运维成本、排除潜在的电力系统隐患提供了有效的技术支持。