论文部分内容阅读
随着电网的不断发展,电网的规模不断扩大,智能电网与信息化相融合,电网所包含的数据呈现爆发式增加。当电网发生异常或故障时,会有大量的告警信息数据通过监控系统上传到监控告警窗口中,这些告警信息数量巨大且难以有效利用。若将文本挖掘应用于电网告警信息,从告警信息中挖掘出所需要的、有价值的信息,充分利用底层数据,可以实现变电站端与调度端信息有机结合,有利于变电站运维端快速处理故障、准确查明故障原因。
本文以实现智能电网“可自愈”为目的,针对电网监控告警信息数量众多且难以获取有价值及所需要的信息的问题,开展对于告警信息文本挖掘技术的研究,对告警信息进行文本预处理、文本分类、信息抽取及信息存储等过程,并提出了故障追踪的概念,利用告警信息进行继电保护装置故障原因反向追踪。综上所述,本文提出了一种基于文本挖掘的电网告警信息智能识别及自动分类方法,并将挖掘出有价值的告警信息进行故障后故障原因追踪的应用研究。具体工作及取得的成果如下:
(1)针对电网监控告警遥信信息的特点,制定了告警信息文本挖掘的方法和流程,通过对告警信息进行中文分词、去停用词等过程实现文本清洗,再通过word2vec中的Skip-Gram模型对告警信息进行分布式表示的词向量训练,实现了文本的语义特征提取,实现了非结构化数据向结构化数据的转变,将计算机难以识别的告警信息中文文本转换为计算机能够智能识别的文本表示方法。
(2)以构建电网告警信息语义模型的方式,对告警信息进行信息存储,其中语义模型的建立,通过模式匹配算法--Horspool算法,对告警信息进行信息抽取。为实现对告警信息的自动文本分类,先通过树结构匹配的方式,将抽取出来的告警信息按照树结构标准进行等级分类,实现对告警信息的标准化分类;然后,构建基于深度学习的TextCNN分类模型,通过选取历史告警信息作为语料对模型进行训练,实现对告警信息的自动文本分类,并在Python环境下实验对比验证了分类器的分类效果。
(3)将预处理及抽取分类后的告警信息进行故障诊断及故障追踪应用研究,利用告警信息反向追踪继电保护装置不正确动作的原因,制定了故障追踪所需告警信息的筛选规则,将FSM模型与告警信息相结合,构建基于告警信息的FSM模型,通过对海量告警信息进行文本挖掘的方式反映了继电保护装置的不正确动作原因,实现了对故障设备的故障追踪。最后,在实际案例中验证了该故障追踪方法的有效性。
本文以实现智能电网“可自愈”为目的,针对电网监控告警信息数量众多且难以获取有价值及所需要的信息的问题,开展对于告警信息文本挖掘技术的研究,对告警信息进行文本预处理、文本分类、信息抽取及信息存储等过程,并提出了故障追踪的概念,利用告警信息进行继电保护装置故障原因反向追踪。综上所述,本文提出了一种基于文本挖掘的电网告警信息智能识别及自动分类方法,并将挖掘出有价值的告警信息进行故障后故障原因追踪的应用研究。具体工作及取得的成果如下:
(1)针对电网监控告警遥信信息的特点,制定了告警信息文本挖掘的方法和流程,通过对告警信息进行中文分词、去停用词等过程实现文本清洗,再通过word2vec中的Skip-Gram模型对告警信息进行分布式表示的词向量训练,实现了文本的语义特征提取,实现了非结构化数据向结构化数据的转变,将计算机难以识别的告警信息中文文本转换为计算机能够智能识别的文本表示方法。
(2)以构建电网告警信息语义模型的方式,对告警信息进行信息存储,其中语义模型的建立,通过模式匹配算法--Horspool算法,对告警信息进行信息抽取。为实现对告警信息的自动文本分类,先通过树结构匹配的方式,将抽取出来的告警信息按照树结构标准进行等级分类,实现对告警信息的标准化分类;然后,构建基于深度学习的TextCNN分类模型,通过选取历史告警信息作为语料对模型进行训练,实现对告警信息的自动文本分类,并在Python环境下实验对比验证了分类器的分类效果。
(3)将预处理及抽取分类后的告警信息进行故障诊断及故障追踪应用研究,利用告警信息反向追踪继电保护装置不正确动作的原因,制定了故障追踪所需告警信息的筛选规则,将FSM模型与告警信息相结合,构建基于告警信息的FSM模型,通过对海量告警信息进行文本挖掘的方式反映了继电保护装置的不正确动作原因,实现了对故障设备的故障追踪。最后,在实际案例中验证了该故障追踪方法的有效性。