论文部分内容阅读
[摘 要]针对电力通信中存在的不确定性和复杂性的特点,提出一种基于粗糙理论与贝叶斯理论的电力通信系统故障检测模型。文章首先利用粗糙理论删除不重要的特征属性,然后通过数理统计方式,得到不同特征属性出现的概率;再次,在该基础上,构建最小属性集的贝叶斯网络故障诊断模型;最后通过试验验证了上述故障定位方法的有效性。
[关键词]贝叶斯模型;粗糙集;故障检测;诊断模型;最小属性
中图分类号:TQ275 文献标识码:A 文章编号:1009-914X(2018)03-0398-01
电力信息通信系统故障诊断是电力信息通信支持系统的重要组成部分。但由于电力信息通信系统线路、硬件和软件系统众多,某个设备或系统发生故障,会引发的一连串故障。同样的出现某个故障现象可能的故障原因也很多。因此为了保障智能电网的平稳运行,如果电力信息通信系统发生某个故障告警,需要快速的从大量的故障原因中准确找出故障根源。快速、准确、的定位电力信息通信系统的故障原因能提高整个智能电网运行的鲁棒性和可靠性, 提高电网服务质量,具有十分重要的价值。
1 粗糙集理论
1.1 粗糙集定义
粗糙集理论用于研究不完整数据、不精确知识的表达、学习、归纳等方法。粗糙集理论是一种刻画不完整性和不确定性信息的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。该理论以对观察和测量所得的数据进行分类的能力为基础,认为知识是基于对对象分类的能力,将知识理解为对数据的划分,这种划分在特定空间上由等价关系构成,将等价关系对空间的划分与知识等同。粗糙集理论利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画,用上近似、下近似和边界来刻画信息的不确定性。使用等价关系集 R 对离散表示的空间 U 进行划分,知识表示为 R 对 U 划分的结果。知识库 K可以定义为:属于 R 中的所有可能的关系对 U 的划分,记为:
(1)
给定一组数据 U与等价关系集 R,在 R 下对 U的划分,称为知识,记为 U/ R 。如果集合 K 能表示成基本等价类组成的并集时,则称集合 K 是可精确定义。否则集合 K 称为非精确集或粗糙集。即如果一个等价关系集对知识的划分存在矛盾时, 则将导致知识的不确定划分,可用粗糙度来度量,使用两个精确集, 即粗糙集的上近似和下近似来描述。
(2)
式中,PRS 为集合X利用粗糙集表达的知识库集合K。
1.2 特征属性化简
在由粗糙集构成的一个知识库中,有一些特征属性是不相关或者不重要的,为了达到特征向量降维的目的,可以在保持知识库分类能力不变的前提下,删除其中不相关或者不重要的特征属性。属性约简可以使粗糙集能够获得分类所需的最小特征属性集,可以在不影响分类精度的条件下降低特征向量的维数,得到最简约的显式表达的分类规则,是其他方法无法得到显式规则,是粗糙集的主要优势。
设R为一族等价关系,,如果,则称r为R中必要的。如果每一个都为R中所必要的,则称R为独立的。设,如果Q是独立的,且ind(Q),则称Q为P的一个约简。此时,P可以由多种约简。P中所有必要关系组成的集合称为P的核,记为core(P),表示P的所有约简组成的交集。
2 基于贝叶斯的诊断模型构建
2.1 贝叶斯理论
一个Bayes网络是一个有向无循环图,图中的节点用随机变量表示,连线代表节点之间的影响概率,用条件概率表示。数学描述为:
若论域,其中表示为各个节点。则各节点的联合概率为:
(3)
Bayes网络的核心是计算后验条件概率分布,设节点有m个基本事件事件发生时,网络中某一节点Q的条件概率分布为:
(4)
根据上述公式可计算与节点相关联的所有节点的条件概率,进而获得导致事件的最可能发生问题的节点,即导致故障的可能原因。
2.2 电力信息通信系统RS-BN故障诊断构建
2.2.1构建思路
粗糙集理论只应用了故障和原因之间的关联信息,对于由故障过程中总结出来的先验知识没有考虑。Bayes网络在故障诊断时,充分利用先验知识考察全部的系统属性。由于引起故障的系统属性有一些是与故障内在原因不相关或不重要的,Bayes网络计算了大量的冗余属性。电力信息通信系统中有大量的系统属性,故障类型众多。因此,本文将融合贝叶斯网络与粗糙集的优点,首先利用粗糙集对冗余属性的约简能力,将系统中冗余的系统属性约简掉,在此基础上,结合系统运行过程中的先验知识,获取具有最小诊断集的贝叶斯网络模型。
2.2.2算法构建
本文实现的电力信息通信系统RS-BN故障诊断模型的详细算法步骤;
算法的具体步骤如下:
①对系统运行的故障记录原始数据进行整理分析,抽取特征属性项、合并近义词和同义词,进行词频统计。
②根据先验知识,形成包括所有系统属性值的故障决策表。
③利用粗糙集理论对决策表进行特征属性约简,形成最小决策规则集,建立故障诊断知识库。
④根据诊断知识库保留的特征属性的词频统计信息与故障数量计算获得特征属性的先验概率信息。
⑤建立系统的贝叶斯网络故障信息诊断模型,包括网络结构中所有存在关联关系的节点以及节点间的连线、原因节点到中间结点、故障节点的条件概率或联合条件概率。
利用上述建立的故障诊断模型,进行电力信息系统故障诊断时,全部故障原因节点发生的概率计算方法如下:
①把结果节点向量输入到贝叶斯网络中。
②对于网络中的每一个没处理过的结点n,如果它具有发生的事实(证据),则标记它为已经处理过,否则继续向下执行。
③如果它的所有子结点中有一个没有处理则不处理这个结点,否则继续向下执行。
④根据节点n所有子结点的概率以及条件概率或联合条件概率,根据条件概率公式,计算结点n的概率分布,并把结点n标记为已处理。
⑤重复②至④,处理完所有节点。
此时,每个原因结点的概率分布就是它的发生/不发生的概率。根据原因节点的概率分布,对故障原因根據概率大小进行排序,如存在概率相近的情况,按照并列事件处理,据此在系统中依次检测故障原因所对应的系统属性,进而快速准备的定位故障原因。
3 实验验证
3.1 属性约简
给出某一电力信息系统出现访问故障时节点指向3个模块节点“信息设备”、“通信设备”、“平台软件”的有向连接图。同时,应用粗糙集属性约简后可得到最小属性集,由此获得最小属性集的诊断规则。
3.2 概率统计
以2012~2016年某市电力通信网络故障频率进行统计,可以得到各故障原因最小属性集的概率。并依次为依据计算出贝叶斯网络中所有连接线的概率信息。依据RS-BN故障诊断模型计算获得此时每个系统属性导致故障的概率。概率大的属性,发生故障的可能性较大,从而实现故障原因的快速定位,提高诊断效率。
4 结束语
利用粗糙集对冗余的系统特征属性进行化简,获得最小的特征属性集,建立最小属性集的贝叶斯网络故障诊断模型,其中网络中的条件概率根据运行记录中的词频信息计算获得,实验结果证明本文方法可有效、快速的定位电力信息通信系统的故障信息,对保障电网的正常运行具有重要价值。
[关键词]贝叶斯模型;粗糙集;故障检测;诊断模型;最小属性
中图分类号:TQ275 文献标识码:A 文章编号:1009-914X(2018)03-0398-01
电力信息通信系统故障诊断是电力信息通信支持系统的重要组成部分。但由于电力信息通信系统线路、硬件和软件系统众多,某个设备或系统发生故障,会引发的一连串故障。同样的出现某个故障现象可能的故障原因也很多。因此为了保障智能电网的平稳运行,如果电力信息通信系统发生某个故障告警,需要快速的从大量的故障原因中准确找出故障根源。快速、准确、的定位电力信息通信系统的故障原因能提高整个智能电网运行的鲁棒性和可靠性, 提高电网服务质量,具有十分重要的价值。
1 粗糙集理论
1.1 粗糙集定义
粗糙集理论用于研究不完整数据、不精确知识的表达、学习、归纳等方法。粗糙集理论是一种刻画不完整性和不确定性信息的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。该理论以对观察和测量所得的数据进行分类的能力为基础,认为知识是基于对对象分类的能力,将知识理解为对数据的划分,这种划分在特定空间上由等价关系构成,将等价关系对空间的划分与知识等同。粗糙集理论利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画,用上近似、下近似和边界来刻画信息的不确定性。使用等价关系集 R 对离散表示的空间 U 进行划分,知识表示为 R 对 U 划分的结果。知识库 K可以定义为:属于 R 中的所有可能的关系对 U 的划分,记为:
(1)
给定一组数据 U与等价关系集 R,在 R 下对 U的划分,称为知识,记为 U/ R 。如果集合 K 能表示成基本等价类组成的并集时,则称集合 K 是可精确定义。否则集合 K 称为非精确集或粗糙集。即如果一个等价关系集对知识的划分存在矛盾时, 则将导致知识的不确定划分,可用粗糙度来度量,使用两个精确集, 即粗糙集的上近似和下近似来描述。
(2)
式中,PRS 为集合X利用粗糙集表达的知识库集合K。
1.2 特征属性化简
在由粗糙集构成的一个知识库中,有一些特征属性是不相关或者不重要的,为了达到特征向量降维的目的,可以在保持知识库分类能力不变的前提下,删除其中不相关或者不重要的特征属性。属性约简可以使粗糙集能够获得分类所需的最小特征属性集,可以在不影响分类精度的条件下降低特征向量的维数,得到最简约的显式表达的分类规则,是其他方法无法得到显式规则,是粗糙集的主要优势。
设R为一族等价关系,,如果,则称r为R中必要的。如果每一个都为R中所必要的,则称R为独立的。设,如果Q是独立的,且ind(Q),则称Q为P的一个约简。此时,P可以由多种约简。P中所有必要关系组成的集合称为P的核,记为core(P),表示P的所有约简组成的交集。
2 基于贝叶斯的诊断模型构建
2.1 贝叶斯理论
一个Bayes网络是一个有向无循环图,图中的节点用随机变量表示,连线代表节点之间的影响概率,用条件概率表示。数学描述为:
若论域,其中表示为各个节点。则各节点的联合概率为:
(3)
Bayes网络的核心是计算后验条件概率分布,设节点有m个基本事件事件发生时,网络中某一节点Q的条件概率分布为:
(4)
根据上述公式可计算与节点相关联的所有节点的条件概率,进而获得导致事件的最可能发生问题的节点,即导致故障的可能原因。
2.2 电力信息通信系统RS-BN故障诊断构建
2.2.1构建思路
粗糙集理论只应用了故障和原因之间的关联信息,对于由故障过程中总结出来的先验知识没有考虑。Bayes网络在故障诊断时,充分利用先验知识考察全部的系统属性。由于引起故障的系统属性有一些是与故障内在原因不相关或不重要的,Bayes网络计算了大量的冗余属性。电力信息通信系统中有大量的系统属性,故障类型众多。因此,本文将融合贝叶斯网络与粗糙集的优点,首先利用粗糙集对冗余属性的约简能力,将系统中冗余的系统属性约简掉,在此基础上,结合系统运行过程中的先验知识,获取具有最小诊断集的贝叶斯网络模型。
2.2.2算法构建
本文实现的电力信息通信系统RS-BN故障诊断模型的详细算法步骤;
算法的具体步骤如下:
①对系统运行的故障记录原始数据进行整理分析,抽取特征属性项、合并近义词和同义词,进行词频统计。
②根据先验知识,形成包括所有系统属性值的故障决策表。
③利用粗糙集理论对决策表进行特征属性约简,形成最小决策规则集,建立故障诊断知识库。
④根据诊断知识库保留的特征属性的词频统计信息与故障数量计算获得特征属性的先验概率信息。
⑤建立系统的贝叶斯网络故障信息诊断模型,包括网络结构中所有存在关联关系的节点以及节点间的连线、原因节点到中间结点、故障节点的条件概率或联合条件概率。
利用上述建立的故障诊断模型,进行电力信息系统故障诊断时,全部故障原因节点发生的概率计算方法如下:
①把结果节点向量输入到贝叶斯网络中。
②对于网络中的每一个没处理过的结点n,如果它具有发生的事实(证据),则标记它为已经处理过,否则继续向下执行。
③如果它的所有子结点中有一个没有处理则不处理这个结点,否则继续向下执行。
④根据节点n所有子结点的概率以及条件概率或联合条件概率,根据条件概率公式,计算结点n的概率分布,并把结点n标记为已处理。
⑤重复②至④,处理完所有节点。
此时,每个原因结点的概率分布就是它的发生/不发生的概率。根据原因节点的概率分布,对故障原因根據概率大小进行排序,如存在概率相近的情况,按照并列事件处理,据此在系统中依次检测故障原因所对应的系统属性,进而快速准备的定位故障原因。
3 实验验证
3.1 属性约简
给出某一电力信息系统出现访问故障时节点指向3个模块节点“信息设备”、“通信设备”、“平台软件”的有向连接图。同时,应用粗糙集属性约简后可得到最小属性集,由此获得最小属性集的诊断规则。
3.2 概率统计
以2012~2016年某市电力通信网络故障频率进行统计,可以得到各故障原因最小属性集的概率。并依次为依据计算出贝叶斯网络中所有连接线的概率信息。依据RS-BN故障诊断模型计算获得此时每个系统属性导致故障的概率。概率大的属性,发生故障的可能性较大,从而实现故障原因的快速定位,提高诊断效率。
4 结束语
利用粗糙集对冗余的系统特征属性进行化简,获得最小的特征属性集,建立最小属性集的贝叶斯网络故障诊断模型,其中网络中的条件概率根据运行记录中的词频信息计算获得,实验结果证明本文方法可有效、快速的定位电力信息通信系统的故障信息,对保障电网的正常运行具有重要价值。