论文部分内容阅读
摘要:基于电力负荷特性分析,电力公司能够为用户提供更好的服务。以前的分析不能很好地表达用户的用电负荷特性,因此,采用SOM神经网络聚类方法来解决这个问题。先对获取的数据进行归一化处理,然后采用MATLAB仿真输出可视化聚类结果,最后得到了一个详细的分析结果。根据SOM神经网络显示的结果,不同类型公变用户的用电行为是有差异的,因此有一个很好的聚类效果。
关键词:SOM神经网络;负荷特性曲线;聚类分析
中图分类号:TM7 文献标识码:A 文章编号:1007-0079(2014)33-0204-03
在国家提出建设坚强智能电网的背景下,提高电力营销服务水平和智能用电技术已成为电网企业关注的焦点。电力营销服務水平与智能用电技术的提升离不开在对电力用户用电行为特征的准确、全面、及时地掌握,而从海量负荷数据中提取用户日负荷特征曲线并进行深入分析成为研究用户用电行为特征的一种有效方式。
从研究对象层面来看,以往相关研究侧重专线用户(负荷数据来源为SCADA系统)和专变用户,并以传统意义上的行业分类作为提取负荷特征曲线时聚类的依据。从研究方法层面来看,电力用户日负荷特征曲线的提取多使用聚类算法,主要有统计方法、机器学习方法、人工神经网络方法和面向数据库的方法。人工神经网络因具有大规模的并行协同处理能力、较强的容错能力、联想能力、学习能力和自适应能力,故能够较好地适应海量数据背景下的数据挖掘。应用较多的典型的神经网络模型包括BP网络、Hopfield网络、ART网络和Kohonen网络。[1-3]BP网络属于有监督学习的神经网络,需要提供聚类对象类别数量的先验知识,而公变用户缺乏传统意义上类似专变用户的行业分类,故不适合采用BP网络。Hopfield网络、ART网络和Kohonen网络都属于无监督学习的神经网络,在解决聚类问题上有其各自的优缺点。
本文提出采用SOM神经网络[4-6]聚类算法提取公变用户日负荷特征曲线,用MATLAB软件进行仿真,输出可视化聚类结果,并对聚类结果进行分析,验证了采用SOM神经网络聚类算法提取出的公变用户日负荷特征曲线能够较好地显示不同类型公变用户用电行为特征上的差异,具备良好的聚类效果,同时为电网企业优化电力营销服务提供参考和指导。
一、SOM神经网络
SOM(Self-Organizing Map,自组织映射)神经网络是较为广泛应用于聚类的神经网络。它是由Cohonen提出的一种无监督学习的竞争型神经网络模型,通过不断缩小获胜神经元的邻域来达到聚类的目的。主要功能是将输入的高维空间数据映射到一个较低的维度,通常是一维或者二维输出,同时保持数据原有的拓扑逻辑关系。
SOM神经网络由输入层和输出层两层组成,输入层中的每一个神经元通过权与输出层中的每一个神经元相连,如图1所示。输入层的神经元以一维的形式排列,输入神经元的个数由输入矢量中的分量个数决定,输出层的神经元一般以一维或者二维的形式排列,计输入层的神经元数量为m,输出层神经元数量为c。输入的样本总数为n,第i个输入样本用矢量表示为,每个输出神经元的输出值记为,。与第j个输出神经元相连的权用矢量表示为:。
Kohonen算法是无教师示教的聚类方法,它能将任意维输入模式在输入层映射成一维或二维离散图形,并保持其拓扑结构不变,即在无教师示教的情况下,通过对输入模式的自组织学习,在输出层将聚类结果表示出来。此外,网络通过对输入模式的反复学习,可以使连接权矢量空间分布密度与输入模式的概率分布趋于一致,即连接权矢量空间分布能反映输入模式的统计特性。该算法往往在完成极高维数、超大量数据和高度非线性问题的聚类,模式表征和数据压缩,分类等任务时是一个很有效、很简便,且快速、稳健、泛化性好的算法。
Kohonen的学习算法如下:
(1)初始化:将整个输入向量存储在矩阵p中,对权值w进行初始化,权值向量的每一维的取值范围同输入向量每一维的取值范围。
(2)选择一个输入向量,提供给网络输入层。
(3)按照下式计算输出层每一个神经元 j 的权值与输入向量之差:,其中,。
(4)按照“胜者为王”的原则,对每一个神经元j,以minDist中的最小值所对应的神经元 k作为胜者,对它和它的邻域内的神经元的权值进行调整,假设当前处于学习的第l步,权值的修正按照下式进行:
其中,lr表示学习速率,br表示邻域调整率;表示获胜神经元的邻域,即:。
(5)选择另一个输入向量,返回(3),直到所有的输入向量全部提供给网络。
(6)返回(2),直到达到最大训练步数。
二、MATLAB仿真算例
1.MATLAB仿真实现
对于日负荷特征曲线的提取,负荷曲线的采样点越多,曲线越精细,越容易进行分类,研究数据来自于电力用户用电信息采集系统,从中提取公变用户每15分钟采集一次的有功功率构成其日负荷曲线,一天共96个采样点。从某省电力用户用电信息采集系统中随机抽取1000台公用变压器,选取其2012年7月10日(工作日,该省全年负荷最高日)作为典型日进行日负荷特征曲线提取和分析。每台公变日负荷曲线由96个有功采样点组成。由于每台公变额定容量大小不等,为了有效聚类,首先需要对负荷数据进行归一化处理。
本文采用聚类SOM神经网络,在MATLAB环境下,对这些数据进行聚类仿真。聚类SOM神经网络的MATLAB实现步骤如下:(1)准备数据源。首先从原始数据库读取相关数据(输入样本总数70,每一个样本有96个采集时点)作为输入矢量,并将其以二维数组70×96形式输入。(2)确定参数。输入神经元个数为采集时点的个数96;输出神经元以二维数组3×3形式呈现。(3)运用rand( )函数产生[0,1)之间的随机数作为权值。(4)调用SOM创建函数newsom( ),创建自组织映射网络net=newsom( )。(5)对迭代次数net.trainParam.epochs赋值2000;对net.trainParam.show赋值20,表示每20次显示一下误差变化情况。(6)运用网络训练函数train( )训练上述初始化后的网络net=train( )。(7)调用plot( )画输入点; plotsom( )作训练后的权值点及其与相邻权值点的连线。 2.仿真结果分析
经MATLAB仿真运行后得到聚类结果图2所示:
图2所示为SOM神经网络聚类结果,将样本公变用户分为7个类别,为便于后文描述,不妨按照行优先的顺序为各激活的优胜神经元标识聚类编号,依次分别为为:公变用户第一类(包含13个样本用户)、公变用户第二类(包含12个样本用户)、公变用户第三类(包含5个样本用户)、公变用户第四类(包含10个样本用户)、公变用户第五类(包含10个样本用户)、公变用户第六类(包含10个样本用户)、公变用户第七类(包含10个样本用户)。
每个竞争层神经元与各输入神经元之间的连接权构成的向量代表了该优胜神经元所标识类别的聚类中心即日负荷特征曲线,竞争层神经元邻域权值距离如图3所示,颜色越深表示领域神经元间的权值距离越远,即邻域神经元的聚类中心距离越远、提取的日负荷特征曲线差异越大。
图4所示为通过SOM神经网络聚类算法提取的七大类公变用户日负荷特征曲线。日负荷特征曲线较为明显地反映了不同类型公变用户在该典型日的用电行为。
第一类公变日负荷特征曲线呈现出明显的午高峰和晚高峰特征,且晚高峰明显高于午高峰。推测此类为城镇居民生活的典型日负荷特征曲线,可能由于部分居民上班因素造成晚高峰高于午高峰;第二类公变日负荷特征曲线走势同全网负荷基本一致,呈现出明显午高峰和晚高峰,但午高峰一枝独秀,可能该公变下的用户类型较多,包括居民用户和一般工商业用户,由于各类用电特征比例与全网比例类似,形成具有全网负荷特征的曲线;第七类公变日负荷特征曲线与前六种主要集中在白天用电不同,主要在天黑时间段内(晚上7点左右至第二天早上6点)用电,推测这类用户主要集中在市政工程类。
三、总结与展望
本文将SOM神经网络聚类算法应用到电力用户日负荷特征曲线提取的研究中,选取某省公变用户作为分析样本,通过MATLAB仿真计算将样本公变用户分为七个类别,以优胜神经元与输入神经元之间连接权向量作为聚类中心即该类别用户的日负荷特征曲线。根据提取出的日负荷特征曲线,结合电力用户用电信息采集系统中的营销档案分析了不同类别公变用户的用电特征与习惯。分析表明,采用SOM神经网络聚类算法提取日负荷特征曲线具有良好的效果,提取出的日负荷特征曲线能够较好反映该类型用户的用电行为与特征,为电力企业了解用户用电习惯、细分电力市场、调整定价策略和实施需求侧管理提供了有益参考。
下一步研究将考虑采用电力用户全年负荷数据进行聚类分析,验证小样本下的聚类结果、发现新的用户类型;同时改进SOM神经网络算法,使其适应海量数据下的负荷曲线聚类分析,并通过调整竞争层神经元个数与抑制权值使训练结果更加稳定,得到更好的聚类效果。
参考文献:
[1]马玉梅,马志超.基于人工神经网络的手写阿拉伯数字识别[J].中央民族大学学报(自然科学版),2007,(4).
[2]刘小波,李亚玲,赵景涛,等.基于KOHONEN神经网络的电压控制分区[J].浙江电力,2007,(3).
[3]莫礼平.基于Kohonen神经网络的故障诊断方法[J].成都大学学报(自然科学版),2007,(1).
[4]李培强,李欣然,陈辉华,等.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,(24).
[5]张红斌,贺仁睦,刘应梅.基于KOHONEN神经网络的电力系统负荷动特性聚类与综合[J].中国电机工程学报,2003,(5).
[6]高琳琦,李从东.个性化产品推薦中的SOFM神经网络模型[J].天津师范大学学报(自然科学版),2006,(2).
(责任编辑:王意琴)
关键词:SOM神经网络;负荷特性曲线;聚类分析
中图分类号:TM7 文献标识码:A 文章编号:1007-0079(2014)33-0204-03
在国家提出建设坚强智能电网的背景下,提高电力营销服务水平和智能用电技术已成为电网企业关注的焦点。电力营销服務水平与智能用电技术的提升离不开在对电力用户用电行为特征的准确、全面、及时地掌握,而从海量负荷数据中提取用户日负荷特征曲线并进行深入分析成为研究用户用电行为特征的一种有效方式。
从研究对象层面来看,以往相关研究侧重专线用户(负荷数据来源为SCADA系统)和专变用户,并以传统意义上的行业分类作为提取负荷特征曲线时聚类的依据。从研究方法层面来看,电力用户日负荷特征曲线的提取多使用聚类算法,主要有统计方法、机器学习方法、人工神经网络方法和面向数据库的方法。人工神经网络因具有大规模的并行协同处理能力、较强的容错能力、联想能力、学习能力和自适应能力,故能够较好地适应海量数据背景下的数据挖掘。应用较多的典型的神经网络模型包括BP网络、Hopfield网络、ART网络和Kohonen网络。[1-3]BP网络属于有监督学习的神经网络,需要提供聚类对象类别数量的先验知识,而公变用户缺乏传统意义上类似专变用户的行业分类,故不适合采用BP网络。Hopfield网络、ART网络和Kohonen网络都属于无监督学习的神经网络,在解决聚类问题上有其各自的优缺点。
本文提出采用SOM神经网络[4-6]聚类算法提取公变用户日负荷特征曲线,用MATLAB软件进行仿真,输出可视化聚类结果,并对聚类结果进行分析,验证了采用SOM神经网络聚类算法提取出的公变用户日负荷特征曲线能够较好地显示不同类型公变用户用电行为特征上的差异,具备良好的聚类效果,同时为电网企业优化电力营销服务提供参考和指导。
一、SOM神经网络
SOM(Self-Organizing Map,自组织映射)神经网络是较为广泛应用于聚类的神经网络。它是由Cohonen提出的一种无监督学习的竞争型神经网络模型,通过不断缩小获胜神经元的邻域来达到聚类的目的。主要功能是将输入的高维空间数据映射到一个较低的维度,通常是一维或者二维输出,同时保持数据原有的拓扑逻辑关系。
SOM神经网络由输入层和输出层两层组成,输入层中的每一个神经元通过权与输出层中的每一个神经元相连,如图1所示。输入层的神经元以一维的形式排列,输入神经元的个数由输入矢量中的分量个数决定,输出层的神经元一般以一维或者二维的形式排列,计输入层的神经元数量为m,输出层神经元数量为c。输入的样本总数为n,第i个输入样本用矢量表示为,每个输出神经元的输出值记为,。与第j个输出神经元相连的权用矢量表示为:。
Kohonen算法是无教师示教的聚类方法,它能将任意维输入模式在输入层映射成一维或二维离散图形,并保持其拓扑结构不变,即在无教师示教的情况下,通过对输入模式的自组织学习,在输出层将聚类结果表示出来。此外,网络通过对输入模式的反复学习,可以使连接权矢量空间分布密度与输入模式的概率分布趋于一致,即连接权矢量空间分布能反映输入模式的统计特性。该算法往往在完成极高维数、超大量数据和高度非线性问题的聚类,模式表征和数据压缩,分类等任务时是一个很有效、很简便,且快速、稳健、泛化性好的算法。
Kohonen的学习算法如下:
(1)初始化:将整个输入向量存储在矩阵p中,对权值w进行初始化,权值向量的每一维的取值范围同输入向量每一维的取值范围。
(2)选择一个输入向量,提供给网络输入层。
(3)按照下式计算输出层每一个神经元 j 的权值与输入向量之差:,其中,。
(4)按照“胜者为王”的原则,对每一个神经元j,以minDist中的最小值所对应的神经元 k作为胜者,对它和它的邻域内的神经元的权值进行调整,假设当前处于学习的第l步,权值的修正按照下式进行:
其中,lr表示学习速率,br表示邻域调整率;表示获胜神经元的邻域,即:。
(5)选择另一个输入向量,返回(3),直到所有的输入向量全部提供给网络。
(6)返回(2),直到达到最大训练步数。
二、MATLAB仿真算例
1.MATLAB仿真实现
对于日负荷特征曲线的提取,负荷曲线的采样点越多,曲线越精细,越容易进行分类,研究数据来自于电力用户用电信息采集系统,从中提取公变用户每15分钟采集一次的有功功率构成其日负荷曲线,一天共96个采样点。从某省电力用户用电信息采集系统中随机抽取1000台公用变压器,选取其2012年7月10日(工作日,该省全年负荷最高日)作为典型日进行日负荷特征曲线提取和分析。每台公变日负荷曲线由96个有功采样点组成。由于每台公变额定容量大小不等,为了有效聚类,首先需要对负荷数据进行归一化处理。
本文采用聚类SOM神经网络,在MATLAB环境下,对这些数据进行聚类仿真。聚类SOM神经网络的MATLAB实现步骤如下:(1)准备数据源。首先从原始数据库读取相关数据(输入样本总数70,每一个样本有96个采集时点)作为输入矢量,并将其以二维数组70×96形式输入。(2)确定参数。输入神经元个数为采集时点的个数96;输出神经元以二维数组3×3形式呈现。(3)运用rand( )函数产生[0,1)之间的随机数作为权值。(4)调用SOM创建函数newsom( ),创建自组织映射网络net=newsom( )。(5)对迭代次数net.trainParam.epochs赋值2000;对net.trainParam.show赋值20,表示每20次显示一下误差变化情况。(6)运用网络训练函数train( )训练上述初始化后的网络net=train( )。(7)调用plot( )画输入点; plotsom( )作训练后的权值点及其与相邻权值点的连线。 2.仿真结果分析
经MATLAB仿真运行后得到聚类结果图2所示:
图2所示为SOM神经网络聚类结果,将样本公变用户分为7个类别,为便于后文描述,不妨按照行优先的顺序为各激活的优胜神经元标识聚类编号,依次分别为为:公变用户第一类(包含13个样本用户)、公变用户第二类(包含12个样本用户)、公变用户第三类(包含5个样本用户)、公变用户第四类(包含10个样本用户)、公变用户第五类(包含10个样本用户)、公变用户第六类(包含10个样本用户)、公变用户第七类(包含10个样本用户)。
每个竞争层神经元与各输入神经元之间的连接权构成的向量代表了该优胜神经元所标识类别的聚类中心即日负荷特征曲线,竞争层神经元邻域权值距离如图3所示,颜色越深表示领域神经元间的权值距离越远,即邻域神经元的聚类中心距离越远、提取的日负荷特征曲线差异越大。
图4所示为通过SOM神经网络聚类算法提取的七大类公变用户日负荷特征曲线。日负荷特征曲线较为明显地反映了不同类型公变用户在该典型日的用电行为。
第一类公变日负荷特征曲线呈现出明显的午高峰和晚高峰特征,且晚高峰明显高于午高峰。推测此类为城镇居民生活的典型日负荷特征曲线,可能由于部分居民上班因素造成晚高峰高于午高峰;第二类公变日负荷特征曲线走势同全网负荷基本一致,呈现出明显午高峰和晚高峰,但午高峰一枝独秀,可能该公变下的用户类型较多,包括居民用户和一般工商业用户,由于各类用电特征比例与全网比例类似,形成具有全网负荷特征的曲线;第七类公变日负荷特征曲线与前六种主要集中在白天用电不同,主要在天黑时间段内(晚上7点左右至第二天早上6点)用电,推测这类用户主要集中在市政工程类。
三、总结与展望
本文将SOM神经网络聚类算法应用到电力用户日负荷特征曲线提取的研究中,选取某省公变用户作为分析样本,通过MATLAB仿真计算将样本公变用户分为七个类别,以优胜神经元与输入神经元之间连接权向量作为聚类中心即该类别用户的日负荷特征曲线。根据提取出的日负荷特征曲线,结合电力用户用电信息采集系统中的营销档案分析了不同类别公变用户的用电特征与习惯。分析表明,采用SOM神经网络聚类算法提取日负荷特征曲线具有良好的效果,提取出的日负荷特征曲线能够较好反映该类型用户的用电行为与特征,为电力企业了解用户用电习惯、细分电力市场、调整定价策略和实施需求侧管理提供了有益参考。
下一步研究将考虑采用电力用户全年负荷数据进行聚类分析,验证小样本下的聚类结果、发现新的用户类型;同时改进SOM神经网络算法,使其适应海量数据下的负荷曲线聚类分析,并通过调整竞争层神经元个数与抑制权值使训练结果更加稳定,得到更好的聚类效果。
参考文献:
[1]马玉梅,马志超.基于人工神经网络的手写阿拉伯数字识别[J].中央民族大学学报(自然科学版),2007,(4).
[2]刘小波,李亚玲,赵景涛,等.基于KOHONEN神经网络的电压控制分区[J].浙江电力,2007,(3).
[3]莫礼平.基于Kohonen神经网络的故障诊断方法[J].成都大学学报(自然科学版),2007,(1).
[4]李培强,李欣然,陈辉华,等.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,(24).
[5]张红斌,贺仁睦,刘应梅.基于KOHONEN神经网络的电力系统负荷动特性聚类与综合[J].中国电机工程学报,2003,(5).
[6]高琳琦,李从东.个性化产品推薦中的SOFM神经网络模型[J].天津师范大学学报(自然科学版),2006,(2).
(责任编辑:王意琴)