论文部分内容阅读
在大数据时代的背景下,我国电力企业更加重视营销业务的信息化,十三五电力发展规划中指出,利用大数据等技术提升信息平台承载能力和业务应用水平。随着用电信息采集系统的推广,海量的用电数据得以采集,为用电环节的大数据分析提供了坚实的数据基础。但是面对海量用电数据的增加,目前大多数电力部门仅使用传统的统计方法进行异常分析,异常数据背后蕴藏的事件信息无法得到有效提炼。为此,有必要将数据挖掘技术引入到异常分析中,充分挖掘用电数据的异常信息。首先,考虑到所有异常都会在电量数据上得以体现,故采用规律性强的日负荷曲线作为异常检测的特征指标。利用具有调节参数少、准确率高、计算效率快等突出优点的孤立森林算法构建异常检测模型,并对模型中的重要参数进行了分析设置。该模型输出所有用户的异常分值及疑似概率排序。研究结果表明,利用该排序,只需要检测异常分值靠前的少数用户即可查出大部分异常用户。其次,为了突出基于孤立森林算法在用电异常检测方面的优越性,通过建立基于聚类分析、局部离群因子算法的异常检测模型并进行比较,发现本文构建的用电数据异常检测模型在计算效率方面的优势尤为显著,并且准确率保持较高,证明了孤立森林算法用于构建用电数据异常检测模型的准确性和高效性。第三,考虑到日负荷曲线受用户用电习惯的影响较大,因此需要结合疑似异常用户的电气变量作进一步分析,建立用电数据异常识别模型,减少误判率。利用决策树算法易于理解实现和效率高等特点,实现对计量点电压进行自动快速分类,并辅助电流数据进行判断,识别出电能计量装置异常。在现场异常排查中,验证了用电数据异常识别模型的有效性。最后,在实际案例中发现,由于异常的电能计量装置中存在残余电压,导致电量追补出现差错。为此,有必要对传统的更正系数计算方法进行改进,通过用电信息采集系统在故障期间冻结的96点电压数据进行分析,综合考虑故障相的残余电压,并研究电能计量装置计算电量的原理,调整更正系数,较现有的方法更全面和更具公正性。