论文部分内容阅读
【摘 要】随着我国的经济在快速的发展,社会在不断的进步,我国配电网多采用小电流接地系统,发生单相接地短路的概率高,如何进行准确的接地选线是一项重要课题。考虑大数据机器学习方法,基于大数据平台对配电网接地选线关键技术进行研究,首次提出了综合考虑电气量与非电气量的故障选线算法;搭建了基于Hadoop技术的配电网接地选线大数据平台,应用接地故障选线的人工神经网络算法,实现了数据的分布式存储与分布式处理等相关技术,大大提高配电网选线的准确性;最后使用故障数据进行验证,证实了该方法的可行性。
【关键词】大数据;接地选线;非电气量;Hadoop平台;人工神经网络
引言
“小电流接地系统”属于中性点非有效接地系统,也称为中性点不直接接地系统,主要有中性点不接地系统、经消弧线圈接地系统(谐振接地系统)两种。目前,配电网采用以中性点经消弧线圈接地为主的小电流接地系统。经消弧线圈接地方式能自动消除瞬时的单相接地故障,具有跳闸次数少、能降低故障电流的优点,但也存在一些缺点:如,经消弧线圈接地系统,单相故障时假如小电流接地选线装置不跳闸,系统将长时间承受过电压,对设备绝缘水平要求高。此外,目前各种原理的小电流选线装置在实际运行中准确率并不高,特别是在高阻接地和弧光接地情况下,准确率更低。在消弧线圈补偿故障电流的作用下,故障残流小,配网智能终端难以检测分辨接地故障电流,导致配网自动化系统因无法获取接地故障信息而失效。
1大数据的定义与特征
关于大数据的定义,虽然业内存在一些共识,但是尚没有统一的定义。麦肯锡将大数据定义为规模超出了现有数据工具的抓取、存储、处理、计算能力的数据集合.认为大数据是指对海量异构数据实现高速的捕捉、分析与发现的技术体系与架构。本文认为,大数据不仅是传统软件难以处理的数据集,也不仅是先进的数据分析与处理技术,而是海量异构数据、高性能大数据处理架构、先进的数据挖掘算法及大数据思维方式的有机结合,并在互联网云计算、大数据可视化等相关领域的延伸。不同行业的大数据千差万别,但是它们都具有五个典型特点,这五个特点通常也被称为,"5个V",分别是规模性(Volume),多样性(Variety),高速性(Velocity),价值性(Value)和真实性(Veracity)。其中:规模性是指数据总量庞大,数据总量已经普遍从GB,TB级上升到PB,EB,ZB级;多样性是指数据类型复杂,来源不同且同时包含结构化、半结构化和非结构化数据;高速性是指数据实时在以指数级别的速度在增长,同时也需要高速的数据处理速度;价值性是指数据是有价值的但是没有得到充分利用,且其价值通常需要挖掘;真实性是指大数据来源于真实的社交网络、企业等数据源,可以体现分析对象的真实特征。
2基于大数据平台的机器学习配电网选线核心算法
2.1数据预处理和特征提取
数据预处理是指在数据挖掘前的数据处理,主要包括数据清理、数据集成、数据变换与数据规约等技术,将原始数据转化为适合挖掘的数据。通过故障特征提取算法实现对大数据的预处理,进行降维操作,降低大数据的维度,保存有用数据,剔除无效数据,实现对数据的智能预处理功能,使数据更满足挖掘需要。故障特征提取是指从原始数据中提取出具有重要物理意义或统计意义的特征数据,可以对原始数据进行有效降维。由于原始数据尤其是电气数据维度太高,数据量太大,并且含有一些无用的信息,所以有必要进行特征提取,提取出有用的数据进行分析。故障特征提取有多种方法,为保证提取数据的有效性,一般根据传统选线方法确定要提取的特征数据。本研究提取14种电气量故障特征数据:故障类型(A相接地故障、B相接地故障、C相接地故障)、故障后各相电压降落(故障后比故障前电压有效值的降落),故障后零序电流幅值与相角,各出线零序电流的小波包能量,零序电流五次谐波幅值与相角,故障后首半波幅值與极性,故障后能量函数,暂态零模特征电流幅值与极性,FTU装设处的零序电流幅值与相角。根据每一条出线获得故障特征变量(体现故障测度),并归一化。由于提取出的气象数据已经为数字量形式,故直接作为特征向量即可。电气量与非电气量故障特征共有20种。
2.2小电流接地选线装置提升选线正确率的管理
(1)加强并网管理严格按小电流接地选线装置技术规范、检验规范开展可研、初设审核、投运前验收工作,确保小电流接地选线装置功能配置、二次回路完善,各线路间隔零序CT接线正确、零序CT安装质量符合标准要求,远动信号传发正确。(2)加强日常管理持续开展小电流接地选线装置选线情况统计。按月对各站小电流接地选装置选线情况进行统计,对选线情况异常的开展排查,确保装置运行正常、二次回路正确、远动信号回传正确。(3)开展专项整改对目前在运的小电流接地选线装置开展全面梳理。对不具备跳闸功能的小电流选线装置开展改造工作,增加跳闸箱、二次控制回路。对零序电流回路接线不正确、无零序CT的间隔,结合线路间隔停电,开展零序CT、回路整改工作。对于信号注入法原理的小电流接线选线装置,出线未安装信号探测器的,结合线路间隔停电,加装信号探测器。
2.3数据预处理方法
实际配网系统中,常由于噪声干扰或通讯等原因,导致原始数据存在错误值、空缺值、噪声等,导致数据质量降低,影响挖掘的准确度。因此,通过预处理来降低错误值、空缺值与噪声的干扰,确保数据质量。(1)空缺值空缺值是指数据中某一属性值的缺失,数据的大范围缺失是无法修复的,但是对于少数几个值的空缺,通常可以用一个值来进行填补。在确定这一填补值时,通常有几种方法:1)使用一个常量来填补空缺值。2)使用缺失属性均值来填补。3)预钡(一个可能值来填补,如通过回归来预测缺失值。在基于大数据的故障选线问题中,面对的原始数据主要是各类波形数据,而波形通常是连续的,因此若出现空缺值情况,可以通过插值的方法来确定空缺值。(2)噪声数据噪声是指互感器在测量电压、电流是产生的随机错误或偏差,包括错误值或者孤立点值。通常使用以下数据平滑技术进行处理:分箱法:分箱法考察数据周围的值并将其分到不同的箱中,然后根据箱中数据的特点来平滑箱中数据,起到数据平滑作用。回归法:回归法通过寻找合适的回归函数来将不同的变量互相关联,然后使用其他变量来预测一个变量,起到数据平滑的效果。聚类法:聚类是一种识别孤立点或离群点的常用方法,那些明显偏离聚类中的数据很可能是错误数据,通过对其删除或更正可以提高数据的质量。
结语
本文研究了利用大数据技术来解决配电网单相接地故障选线的难题。提出了利用多源电气量与非电气量数据,并且综合考虑多种故障特征的一种新的配电网接地故障选线方法。在基于Hadoop技术的大数据平台上,使用人工神经网络的机器学习算法,对海量数据进行深度挖掘与精准拟合,从而大大提高了配电网选线的准确性。使用仿真数据与实际历史故障数据进行了选线准确率验证,证明了本方法的可行性。
参考文献:
[1]李天友,金文龙,徐丙垠,等.配电技术[M].北京:中国电力出版社,2008:1-4.
[2]李燕妮,袁茂林.小电流接地选线装置在配网中的应用[J].电子技术与软件工程,2014(7):170.
(作者单位:国网山东省电力公司齐河县供电公司)
【关键词】大数据;接地选线;非电气量;Hadoop平台;人工神经网络
引言
“小电流接地系统”属于中性点非有效接地系统,也称为中性点不直接接地系统,主要有中性点不接地系统、经消弧线圈接地系统(谐振接地系统)两种。目前,配电网采用以中性点经消弧线圈接地为主的小电流接地系统。经消弧线圈接地方式能自动消除瞬时的单相接地故障,具有跳闸次数少、能降低故障电流的优点,但也存在一些缺点:如,经消弧线圈接地系统,单相故障时假如小电流接地选线装置不跳闸,系统将长时间承受过电压,对设备绝缘水平要求高。此外,目前各种原理的小电流选线装置在实际运行中准确率并不高,特别是在高阻接地和弧光接地情况下,准确率更低。在消弧线圈补偿故障电流的作用下,故障残流小,配网智能终端难以检测分辨接地故障电流,导致配网自动化系统因无法获取接地故障信息而失效。
1大数据的定义与特征
关于大数据的定义,虽然业内存在一些共识,但是尚没有统一的定义。麦肯锡将大数据定义为规模超出了现有数据工具的抓取、存储、处理、计算能力的数据集合.认为大数据是指对海量异构数据实现高速的捕捉、分析与发现的技术体系与架构。本文认为,大数据不仅是传统软件难以处理的数据集,也不仅是先进的数据分析与处理技术,而是海量异构数据、高性能大数据处理架构、先进的数据挖掘算法及大数据思维方式的有机结合,并在互联网云计算、大数据可视化等相关领域的延伸。不同行业的大数据千差万别,但是它们都具有五个典型特点,这五个特点通常也被称为,"5个V",分别是规模性(Volume),多样性(Variety),高速性(Velocity),价值性(Value)和真实性(Veracity)。其中:规模性是指数据总量庞大,数据总量已经普遍从GB,TB级上升到PB,EB,ZB级;多样性是指数据类型复杂,来源不同且同时包含结构化、半结构化和非结构化数据;高速性是指数据实时在以指数级别的速度在增长,同时也需要高速的数据处理速度;价值性是指数据是有价值的但是没有得到充分利用,且其价值通常需要挖掘;真实性是指大数据来源于真实的社交网络、企业等数据源,可以体现分析对象的真实特征。
2基于大数据平台的机器学习配电网选线核心算法
2.1数据预处理和特征提取
数据预处理是指在数据挖掘前的数据处理,主要包括数据清理、数据集成、数据变换与数据规约等技术,将原始数据转化为适合挖掘的数据。通过故障特征提取算法实现对大数据的预处理,进行降维操作,降低大数据的维度,保存有用数据,剔除无效数据,实现对数据的智能预处理功能,使数据更满足挖掘需要。故障特征提取是指从原始数据中提取出具有重要物理意义或统计意义的特征数据,可以对原始数据进行有效降维。由于原始数据尤其是电气数据维度太高,数据量太大,并且含有一些无用的信息,所以有必要进行特征提取,提取出有用的数据进行分析。故障特征提取有多种方法,为保证提取数据的有效性,一般根据传统选线方法确定要提取的特征数据。本研究提取14种电气量故障特征数据:故障类型(A相接地故障、B相接地故障、C相接地故障)、故障后各相电压降落(故障后比故障前电压有效值的降落),故障后零序电流幅值与相角,各出线零序电流的小波包能量,零序电流五次谐波幅值与相角,故障后首半波幅值與极性,故障后能量函数,暂态零模特征电流幅值与极性,FTU装设处的零序电流幅值与相角。根据每一条出线获得故障特征变量(体现故障测度),并归一化。由于提取出的气象数据已经为数字量形式,故直接作为特征向量即可。电气量与非电气量故障特征共有20种。
2.2小电流接地选线装置提升选线正确率的管理
(1)加强并网管理严格按小电流接地选线装置技术规范、检验规范开展可研、初设审核、投运前验收工作,确保小电流接地选线装置功能配置、二次回路完善,各线路间隔零序CT接线正确、零序CT安装质量符合标准要求,远动信号传发正确。(2)加强日常管理持续开展小电流接地选线装置选线情况统计。按月对各站小电流接地选装置选线情况进行统计,对选线情况异常的开展排查,确保装置运行正常、二次回路正确、远动信号回传正确。(3)开展专项整改对目前在运的小电流接地选线装置开展全面梳理。对不具备跳闸功能的小电流选线装置开展改造工作,增加跳闸箱、二次控制回路。对零序电流回路接线不正确、无零序CT的间隔,结合线路间隔停电,开展零序CT、回路整改工作。对于信号注入法原理的小电流接线选线装置,出线未安装信号探测器的,结合线路间隔停电,加装信号探测器。
2.3数据预处理方法
实际配网系统中,常由于噪声干扰或通讯等原因,导致原始数据存在错误值、空缺值、噪声等,导致数据质量降低,影响挖掘的准确度。因此,通过预处理来降低错误值、空缺值与噪声的干扰,确保数据质量。(1)空缺值空缺值是指数据中某一属性值的缺失,数据的大范围缺失是无法修复的,但是对于少数几个值的空缺,通常可以用一个值来进行填补。在确定这一填补值时,通常有几种方法:1)使用一个常量来填补空缺值。2)使用缺失属性均值来填补。3)预钡(一个可能值来填补,如通过回归来预测缺失值。在基于大数据的故障选线问题中,面对的原始数据主要是各类波形数据,而波形通常是连续的,因此若出现空缺值情况,可以通过插值的方法来确定空缺值。(2)噪声数据噪声是指互感器在测量电压、电流是产生的随机错误或偏差,包括错误值或者孤立点值。通常使用以下数据平滑技术进行处理:分箱法:分箱法考察数据周围的值并将其分到不同的箱中,然后根据箱中数据的特点来平滑箱中数据,起到数据平滑作用。回归法:回归法通过寻找合适的回归函数来将不同的变量互相关联,然后使用其他变量来预测一个变量,起到数据平滑的效果。聚类法:聚类是一种识别孤立点或离群点的常用方法,那些明显偏离聚类中的数据很可能是错误数据,通过对其删除或更正可以提高数据的质量。
结语
本文研究了利用大数据技术来解决配电网单相接地故障选线的难题。提出了利用多源电气量与非电气量数据,并且综合考虑多种故障特征的一种新的配电网接地故障选线方法。在基于Hadoop技术的大数据平台上,使用人工神经网络的机器学习算法,对海量数据进行深度挖掘与精准拟合,从而大大提高了配电网选线的准确性。使用仿真数据与实际历史故障数据进行了选线准确率验证,证明了本方法的可行性。
参考文献:
[1]李天友,金文龙,徐丙垠,等.配电技术[M].北京:中国电力出版社,2008:1-4.
[2]李燕妮,袁茂林.小电流接地选线装置在配网中的应用[J].电子技术与软件工程,2014(7):170.
(作者单位:国网山东省电力公司齐河县供电公司)