论文部分内容阅读
以电力系统为目标的网络攻击和设备故障等突发事件会引发用户端的不正常断电和中断,造成巨大的经济损失和安全事故。因此,基于机器学习的电力系统异常检测与分类方法具有重要的研究价值和现实意义。现有的有监督电力系统异常检测与分类方法不能识别未知事件或攻击且训练数据不足时性能骤降,而无监督电力系统异常检测与分类方法性能低下且无法提供异常事件或攻击具体信息,本文提出了两种不同的电力系统异常检测与分类方法来解决以上问题。其具体内容和创新之处如下所示:(1)针对电力系统异常检测查全率较低和性能骤降的问题,本文提出了一种组合型电力系统异常检测方法,该方法能够根据输入训练数据的数量自动选择最佳的检测算法。主要创新点在于当训练数据充足时,使用增强型多粒度级联森林来进行异常检测,利用梯度提升决策树来替换级联森林中的完全随机森林,进一步增强了级联森林的集成性和健壮性,改良后的多粒度级联森林不仅具有深度学习算法的优良特性,还有效地缩短了训练所需的时间,降低了模型的复杂度。当训练数据不足时,使用遗传算法进行异常检测,并且通过浮点数编码对遗传算法进行了改良,从而加快了收敛速度,简化了操作难度,缩短了训练时间,基于遗传算法的异常识别器只需要不到20%训练数据中的正常事件就足以构建异常检测器,有效减少了训练数据的数量,并且也能维持较高的查全率和准确率。(2)针对有监督电力系统异常分类方法不能识别未知事件或攻击且深度学习算法复杂度过高的问题,而无监督电力系统异常分类方法性能低下且无法提供异常事件或攻击具体信息的问题,本文提出了两种不同的电力系统异常分类的方法。主要创新点在于当训练数据充足时,使用基于改良多粒度级联森林的自适应方法来进行电力系统异常的分类,该方法利用半监督学习和轮廓系数设计出系统更新模块,完成分类器的自动更新与进化迭代,此外,利用轮廓系数还能有效识别新型攻击和未知事件。当训练数据不足时,提出的基于半监督聚类的多层分类方法也能保持较高的攻击查全率和分类准确率,其中的标记扩展算法有效增加了训练数据的数量,解决了训练数据不足所导致的分类器性能骤降的问题,并且利用半监督聚类的思想提供了检测出的攻击或者事件的具体信息,最后利用相似度量法筛选出聚类后的未知攻击或者事件。