论文部分内容阅读
由于近年来智能电网的高度发展,使得电网规模不断增加且愈加复杂,这使得对电网中输变电设备的检修与维护变得更加困难。然而为达到保障电网稳定运行,提高电能质量,降低检修成本的要求,需要对电网设备的健康状态和工作年限进一步升级改善。同时在电力系统中的风险由电网的故障和异常组成,因此实现对电网设备风险的辨识就等价于对电网设备中故障和异常的准确判断。然而随着信息采集与传输技术在电力系统中的大量应用,电网中对各个设备的在线监测系统不断完善,因此形成了大量隐含着电网设备异常信息的数据流。本文从数据流处理的角度出发,为解决针对电网设备风险的实时检测问题,进行了以下研究。针对电网设备在线监测数据流的清洗问题,本文提出了基于关联规则的电网设备数据流清洗方法。此方法利用关联规则分析数据流中各个序列的关联强度,提出异常数据检测算法来辨识异常数据,并结合改进后的小波神经网络来完成对数据流的清洗。其中根据各个序列间的关联关系,结合基于滑动窗口的异常数据筛选算法来辨识,数据流内的不良数据,通过改进后的小波神经网络对此数据进行清洗。经过实验证明此方法能够有效甄别出不良数据与由设备异常引起的故障数据,且改进后的小波神经网络具有较好的清洗效果。为解决电网设备异常的实时检测问题,本文基于上述数据清洗算法,提出基于分布式处理的数据流分类模型,为实现对电网数据流的分布式处理,设计了局部节点挖掘方法,与基于不平数据流分类的全局挖掘模式。因此本文在第四章分析了为实现对电网设备数据流的分类,需要构建基于分布式处理的数据流分类模型,然后选取相应数据序列并进行格式化抽象,设计此模型下的局部节点挖掘方法与全局挖掘模式。在局部节点挖掘器中通过对当前数据块的获取,实现块到块的挖掘策略。同时,结合聚类算法完成对局部挖掘模式的表达与实时维护,进而提高各个节点间信息的传输速率,并保证整体分类算法的时效性。针对电网设备数据流中各个类别数据分布不平衡的问题,本文在全局挖掘模式中提出基于不平衡数据流的集成分类算法。该方法首先在中心节点接收到各个局部节点传过来的微簇。然后,为对集成分类器中的基础分类器进行训练更新,提出了基于微簇的学习样本还原算法。利用还原后的数据与经过数据清洗后的异常数据集构建训练数据块,为提高分类器对电网设备风险类别的辨识精度。设计了选择性重采样机制,来平衡当前数据块中各个类别的分布,进而避免对小类别数据识别效率低下的问题。同时,为降低概念漂移给分类器精度带来的影响,针对全局挖掘模式中的集成分类器进行周期性的增量式更新,并在更新分类器时将被一个基础分类器正确预测的样本淘汰,不在用其训练其他基础分类器,以提高集成分类多样性,继而实现对概念漂移的适应。到此完成了全局挖掘模式的任务,并结合局部挖掘模式,实现了对基于分布式的大数据流分类模式的构建。以解决对电网设备风险的实时辨识问题。最后从分类模型的性能,以及对不平衡数据流与概念漂移数据流的分类效果上进行实例验证,结果验证了本文所提方法的有效性。