论文部分内容阅读
摘 要:大量风电并入电网将导致风力发电的不稳定增加,甚至可能造成电网崩溃。因此风电功率的精确预测对合理制定发电计划、保证电力系统稳定运行有着重要意义。本文提出了基于风电功率和基于风速及风电功率的混合残差预测模型,并借助BP、LSSVM及OPELM模型检验混合模型的预测精度。采用承德市风电站的实际功率序列进行预测性能检验。实验结果证实了本文所提出模型的可行性和有效性。
关键词:残差修正 优化极端学习 最小二乘法 风功率预测
随着常规能源的日益枯竭以及环境问题的日益突出,风能的开发利用受到了世界各国的广泛关注。这些年来我国也在大力发展风能,2010年我国已以45GW的风电总装机容量成为世界上风电装机容量第一的国家; 预计到2020年, 全国风电总装机容量将达到300GW。
风功率作为风能资源评估过程中的关键指标,它的准确预测有利于解决风电输出功率难以控制、含新能源的电网安全经济的调度工作以及开放电力市场环境下的风电竞价交易等问题。由于风力发电具有波动性、间歇性及随机性等特点,预测风电功率时需要考虑众多不确定因素的影响。在众多影响因素中,风速影响最大。如果可以比较准确地预测风速以及风功率,就能够有效减轻风电对整个电网的不利影响,提高风的利用率。对此,国内外专家学者进行了深入地探索并提出了多种预测方法。
按照预测机制来划分,风电功率预测方法可分为全局预测法和局部预测法。全局预测法是指利用预测前的历史数据对模型进行训练拟合,从而得到预测结果;局部预测法则是先对当前数据进行预处理,然后依据当前数据所呈现的状态,从历史数据中寻找相近的点来进行拟合预测。按照预测模型来分,风电功率预测模型又可以划分为物理预测模型、统计预测模型、人工智能预测模型和组合预测模型。由于传统的神经网络由于其本身算法的缺陷,经常会遇到收敛速度慢、易陷入局部最优解等问题,最小二乘支持向量机(LSSVM)和极端学习机(ELM)是目前应用在风功率预测领域的新型智能算法,能很好的避免传统算法收敛速度慢等缺陷。
文献[4]主要介绍了支持向量机 (SVM)算法的一些缺陷,并在此基础上引出了最小二乘支持向量(LSSVM)的概念。最小二乘支持向量机(LSSVM)是一种基于结构风险最小化原理的机器学习技术,具有较好的泛化性能和较高的精度,相比于传统的SVM方法,最小二乘支持向量机采用了不同的损失函数, 用等式约束代替了不等式约束,使问题得到了简化, 明显提高了运行效率。
文献[5]所介绍的极端学习机(ELM)是一种比较新颖的单隐层前馈神经网络,极端学习机将传统的神经网络参数的训练的迭代调整成为线性方程组的求解,根据Moore-Penrose 广义逆矩阵理论,求解出具有最小范数的最小二乘解为网络权值,网络的训练过程可一次完成,不需要多次迭代。相比于传统的神经网络算法需要经过多次迭代调整才可以得到最终的网络权值,极端学习机的训练速度有着显著的提高。
文献[6]对常用风功率的预测方法进行了简述,指出传统的预测方法要么预测结果偏差太大,要么就是存在维数灾难或局部极值等方面的问题。此文从常用的风功率预测方法出发,把支持向量机(SVM)回归预测应用到了风功率预测,建立了相应的数学模型,并对多种核函数的选择方法进行了分析。支持向量机在处理非线性问题时,首先将非线性问题转化为高维空间中的线性问题,然后用一个核函数来代替高维空间中的内积运算,从而巧妙地解决了复杂计算问题,并且有效地克服了维数灾难以及局部极小问题。但是SVM模型对于缺失数据十分敏感,并且对于不同的非线性问题没有通用的解决方案。
文献[7]根据风电的随机性强的特点和BP网络预测精度低的特点,提出了基于小波分解和多模型极限学习机的风电功率预测模型。此模型首先通过小波分解将风电功率时间序列分解为不同频段的子序列,然后再用多模型极限学习机分别对子序列建立模型,对于每一个子序列再利用设定的挂起准则将子序列的模型分为两个部分;对于误差大的子序列模型更新模型。
本文给出了基于LSSVM、OPELM方法的新型混合预测模型,通过结合两种残差预测方法,对承德市风力发电数据进行了预测,数据采集辨识度为15min。之后,建立了BP、OPELM和LSSVM模型检验混合模型的预测精度。
一、预测基本模型
1.极端学习机。Huang等人提出了一种名为极端学习机的算法,该算法基于单隐藏层的神经网络结构,并在参数优化方面提出了创新。首先,ELM方法随机初始化了网络隐藏层权值和阈值;接着通过训练数据,建立相应的输入输出方程;最后借助于Moore-Penrose广义逆矩阵理论来求得输出层权值。
考虑一个具有 N 个样本的集合,设单隐藏层网络拥有m个隐藏层神经元,记为输出层阈值向量, f为隐藏层函数, 为输入权重,输入层阈值向量。则单隐藏层网络可构建如下的输入输出方程:
(1)
记
(2)
则该方程可写成矩阵的形式 HB=Y。 之后,極端学习机可以借助广义逆矩阵理论求得相应的权值向量B。
由上述计算可以见得,由于该模型主要依赖于求解线性方程组的理论,相比于传统的误差反向传播算法,极端学习机模型可以成倍地减少运行时间。同时,注意到ELM模型的准确度很大程度上依赖于权值向量W的选取,因此如果当W的选取不当,矩阵B有可能会变得奇异, 从而使得模型精度大幅度降低。因此,修剪多余的隐藏层神经元是一个值得关注的问题。
2.优化极端学习机。为了达到修剪多余神经元的目的, OPELM模型首先利用多稀疏响应回归 (MRSR)算法对隐藏层神经元的重要度进行了排序。之后,借助留一法(LOO)对排序后的模型进行筛选,为了简化运算,我们采用了PRESS准则作为筛选指标:
(3) 其中H为隐藏层权值,D为对角矩阵,其对角元素定义如下:
(4)
3.最小二乘支持向量机。最小支持向量机(LSSVM)是对支持向量机的改进算法,相比于SVM, 该算法拥有更快的计算速度,因此可以用于解决分类、回归等问题,并具有良好的泛化能力。
其算法描述如下:
记l个训练样本,其中代表输入值,代表输出值;
将样本从映射到特征空间中,则估计函数为
(5)
式中: 为加权向量;b 为常值。
根据结构风险最小化原则,求、b 的估计值,有
(6)
约束条件由SVM 中的不等式改为等式约束为
(7)
式中:为惩罚系数,控制对超出误差样本的惩罚程度;为估计误差。
引入拉格朗日乘子,求解该问题,则有
(8)
其中,为拉格朗日乘子。
通过拉格朗日乘数法,可得下述方程:
(9)
消去与,则有
(10)
为解决高维计算问题,利用核函数代替内积计算,则式(10)可转化为
(11)
LSSVM具有非常多的核函数,其中RBF以及多项式函数被研究者广泛的采用。在论文中,我们采用了RBF核函数,并且,LSSVM的主要参数(正则参数c及)通过粒子群算法确定。粒子群算法参数参考文献[16],其中c的变化范围在10-8 到106之间,的变化范围在10-8 到106之间,其余粒子群的参数参表1。
二、残差预测方法
1.基于风功率序列的残差预测模型。已知风功率序列为,首先以风功率为输入、风功率为输出建立Network1,通过对网络训练并预测得预测值
计算相应残差值:
(12)
之后,对于所获得的相对残差序列,再以残差为输入、残差为输出建立Network2进行建模训练。
2.基于风功率及风速序列的残差预测模型。设风速序列为 ,风功率序列为,首先以风速为输入、风速为输出值建立Network1,可得相应预测值; 接着,以风速为输入,风功率为输出建立Network2,可得相应预测值;通过对网络二的预测结果与真实值做差来获得相对残差序列;最后以残差为输入、残差为输出建立Network3。
三、实例分析
本文选取河北省电网内若干典型风电场的全维数据进行特性分析,以承德市2013年1月至2014年11月风电站数据为例分析模型的预测性能,数据采集辨识度为15min。在数据采集过程中,部分缺失数据用NAN表示。我们选用了平均绝对误差(MAE)和相对均方根误差(rRMSE) 作为模型评价依据。其计算公式分别为:
(13)
(14)
模型建立流程参图1。
1.异常数据处理。由于技术局限性,风电场站点中存在部分异常数据。图2显示了某站点风速及风功率数据分布图。其中,X轴为风速数据,Y轴为风功率数据,有图中可以明显看出,当风速接近为0,有部分风功率数据不为0,这明显与实际不符(当风速小于电场的启动风速时,电场实际不发电);此外,部分风功率数据在风速较小时超过了该站点的装机容量,这在实际使用过程中也并不正常。如果不对异常数据进行检测和剔除,将使得样本的质量下降,神经网络的学习受到影响,进而将会导致实验精度的降低。
此外,通过数据统计发现,部分站点中NAN数据过多,从表2可以看出,站点NAN数据比例在10%-30%之间,缺失数据严重的站点可到达40%,这导致数据之间不连贯,数据的规律程度降低。
为此,本文提出了一种切实有效的解决方案:
1.1建立合理的异常值评价措施:(1)对于X正半轴及Y正半轴上的数据进行检测,异常数据标记为NAN;(2)对于取值为负的点,标记为NAN;(3)对于明显超过装机容量的数据,标记为NAN。
1.2如果相邻四个点均为NAN,则从原始数据中剔除此四个NAN值,如果說不全为NAN, 则对该四个点中非NAN的数据进行加权平均,作为该小时的代表值。
2.对比模型。为了增强实验的科学性和合理性,我们采用了BP、PSO-LSSVM和OPELM作为对比模型。其中, BP隐藏层设置为两层,隐藏层神经元个数通过经验公式给出。LSSVM正则化参数由PSO算法计算得出,算法参数参表1。
3.实验结果分析。表3到表6记录了承德市某四个风能发电场详细预测结果,表格7记录了四个站点相对均方根误差。相对均方根误差是风力发电站最重要的考核指标之一,因此下文我们主要以此作为模型评价依据。
根据风力发电系统的需求,风电场功率预测系统提供的实时预测相对均方根误差不超过15%。全天预测结果的相对均方根误差应小于20%。
由表7可以看出,我们所提出来的混合残差模型在短周期预测中显现出良好的精度,均可以达到风力发电要求。在所有的混合残差预测模型中,OPELM+LSSVM表现最优,其rRMSE在1步预测时可以保持在1%以下,1至8步平均相对误差为14.135%,较原始模型有很好的改进。此外,我们可以看到,基于风功率的混合残差模型结果略优于基于风功率与风速的混合残差预测模型,尽管前者利用到了更多的样本信息,但由于风电场数据采集的错误,部分情况下记录下来的风速数据也并不完全准确,因此基于风速及风功率的残差预测模型在使用过程中,可能会出现误差放大的情况,此预测结果也是合理的。
图3分别记录了提前2步、4步、6步及8步预测结果。其中,灰带线代表了当前真实功率上下振幅20%的数值范围。为了增强对比性,图中仅记录了对比模型及两种不同残差预测方法中预测性能最优的两个模型,由该图可以看出,混合残差模型可以很好地跟上风功率的变动,预测值基本落于灰带之间,符合实际发电的需求。 图4 a,c和d记录了在三个站点预测中平均均方根误差,b记载了各模型达到最小mRMSE误差的频率。由图可很明显地看到,混合残差模型的均方根误差小于对比模型,两种不同的残差预测方法在不同的站点中分别达到了误差最小值;两种残差预测方法相比于原始模型有更高的频率达到五個模型中的预测最佳值,两种方法之间并没有明显的优劣之分。因此,在实际使用中本文认为OP+OP+OPLEM或LS+OPELM都具有比较好的预测性能。
四、结语
电能的生产和消耗是同时进行的。准确的风功率预测模型,有利于合理的进行电力系统的规划发展,帮助相关人员合理安排和修订运行计划。这对提高风力发电系统的稳定性、提高发电的经济效益都有着重要意义。本文提出了OP+OP+OPELM 及LS+OPELM 两种不同的混合残差预测模型,此模型较适用于风电场短期预测情形,应用承德市风电场的数据显示,与BP、LSSVM及OPELM 模型相比,新模型具有优越的预测精度及良好的稳定性,适用于风功率短期预测。因此,新型混合模型的提出具有一定的实用性。
参考文献:
[1]廖辉英, 郑世才, 全成文. 基于人工神经网络和粒子群算法的风能预测模型[J]. 微计算机信息, 2012, 10期(10):148-149.
[2]王颖, 魏云军. 风电场风速及风功率预测方法研究综述[J]. 陕西电力, 2012, 39(11):18-21.
[3]郭创新, 王扬, 沈勇,等. 风电场短期风速的多变量局域预测法[J]. 中国电机工程学报, 2012, 32(1):24-31.
[4]冯学军. 最小二乘支持向量机的研究与应用[J]. 安庆师范学院学报:自然科学版, 2009, 15(1):112-113.
[5]张弦, 王宏力. 具有选择与遗忘机制的极端学习机在时间序列预测中的应用[J]. 物理学报, 2011, 60(08): 4-4.
[6]戚双斌, 王维庆, 张新燕. 基于SVM的风速风功率预测模型[J]. 可再生能源, 2010, 04期(04):25-28.
[7]黄庭, 王昕, 李立学,等. 基于小波-极限学习机的短期风电功率预测[J]. 控制工程, 2012, S1期.
[8]Guang-Bin Huang, Qin-Yu Zhu, and Chee-Kheong Siew. Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks, in Proceedings of International Joint Conference on Neural Networks (IJCNN2004):25-29.
[9]Rao, C. Radhakrishna, Mitra, Sujit Kumar. Generalized inverse of a matrix and its applications. Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability 1972; 1:601-620.
[10]Timo Simil¨a and Jarkko Tikka. Multiresponse sparse regression with application multidimensional scaling. Artificial neural networks: formal models and their applications 2005; 3697:97–102.
[11]Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani. Least angle regression. Annals of Statistics 2011; 32:407-499.
[12]G.C. Tiao, R.S. Tsay. Some advances in non-linear and adaptive modelling in time-series. Journal of Forecasting 1994; 13 (2):109–131.
[13]傅美平,马红伟,毛建容. 基于相似日和最小二乘支持向量机的光伏发电短期预测 [J].电力系统保护与控制,2012:65-69.
[14]S.Z. Chamkalani, R. Chamkalani, A. Lohi, A. Elkamel, I. Chatzis Utilization of support vector machine to calculate gas compressibility factor, Fluid Phase Equilib, 358 (2013) 189–202.
[15]J.V. J.A.K. Suykens, Least squares support vector machine classifiers, Neural Process. Lett., 9 (1999) 293-300.
[16]A.Chamkalani, S. Zendehboudi, A. Bahadori, R. Kharrat, R. Chamkalani, L. James, I. Chatzis, Integration of LSSVM technique with PSO to determine asphaltene deposition, J Petrol Sci Eng, 124 (2014) 243-253.
关键词:残差修正 优化极端学习 最小二乘法 风功率预测
随着常规能源的日益枯竭以及环境问题的日益突出,风能的开发利用受到了世界各国的广泛关注。这些年来我国也在大力发展风能,2010年我国已以45GW的风电总装机容量成为世界上风电装机容量第一的国家; 预计到2020年, 全国风电总装机容量将达到300GW。
风功率作为风能资源评估过程中的关键指标,它的准确预测有利于解决风电输出功率难以控制、含新能源的电网安全经济的调度工作以及开放电力市场环境下的风电竞价交易等问题。由于风力发电具有波动性、间歇性及随机性等特点,预测风电功率时需要考虑众多不确定因素的影响。在众多影响因素中,风速影响最大。如果可以比较准确地预测风速以及风功率,就能够有效减轻风电对整个电网的不利影响,提高风的利用率。对此,国内外专家学者进行了深入地探索并提出了多种预测方法。
按照预测机制来划分,风电功率预测方法可分为全局预测法和局部预测法。全局预测法是指利用预测前的历史数据对模型进行训练拟合,从而得到预测结果;局部预测法则是先对当前数据进行预处理,然后依据当前数据所呈现的状态,从历史数据中寻找相近的点来进行拟合预测。按照预测模型来分,风电功率预测模型又可以划分为物理预测模型、统计预测模型、人工智能预测模型和组合预测模型。由于传统的神经网络由于其本身算法的缺陷,经常会遇到收敛速度慢、易陷入局部最优解等问题,最小二乘支持向量机(LSSVM)和极端学习机(ELM)是目前应用在风功率预测领域的新型智能算法,能很好的避免传统算法收敛速度慢等缺陷。
文献[4]主要介绍了支持向量机 (SVM)算法的一些缺陷,并在此基础上引出了最小二乘支持向量(LSSVM)的概念。最小二乘支持向量机(LSSVM)是一种基于结构风险最小化原理的机器学习技术,具有较好的泛化性能和较高的精度,相比于传统的SVM方法,最小二乘支持向量机采用了不同的损失函数, 用等式约束代替了不等式约束,使问题得到了简化, 明显提高了运行效率。
文献[5]所介绍的极端学习机(ELM)是一种比较新颖的单隐层前馈神经网络,极端学习机将传统的神经网络参数的训练的迭代调整成为线性方程组的求解,根据Moore-Penrose 广义逆矩阵理论,求解出具有最小范数的最小二乘解为网络权值,网络的训练过程可一次完成,不需要多次迭代。相比于传统的神经网络算法需要经过多次迭代调整才可以得到最终的网络权值,极端学习机的训练速度有着显著的提高。
文献[6]对常用风功率的预测方法进行了简述,指出传统的预测方法要么预测结果偏差太大,要么就是存在维数灾难或局部极值等方面的问题。此文从常用的风功率预测方法出发,把支持向量机(SVM)回归预测应用到了风功率预测,建立了相应的数学模型,并对多种核函数的选择方法进行了分析。支持向量机在处理非线性问题时,首先将非线性问题转化为高维空间中的线性问题,然后用一个核函数来代替高维空间中的内积运算,从而巧妙地解决了复杂计算问题,并且有效地克服了维数灾难以及局部极小问题。但是SVM模型对于缺失数据十分敏感,并且对于不同的非线性问题没有通用的解决方案。
文献[7]根据风电的随机性强的特点和BP网络预测精度低的特点,提出了基于小波分解和多模型极限学习机的风电功率预测模型。此模型首先通过小波分解将风电功率时间序列分解为不同频段的子序列,然后再用多模型极限学习机分别对子序列建立模型,对于每一个子序列再利用设定的挂起准则将子序列的模型分为两个部分;对于误差大的子序列模型更新模型。
本文给出了基于LSSVM、OPELM方法的新型混合预测模型,通过结合两种残差预测方法,对承德市风力发电数据进行了预测,数据采集辨识度为15min。之后,建立了BP、OPELM和LSSVM模型检验混合模型的预测精度。
一、预测基本模型
1.极端学习机。Huang等人提出了一种名为极端学习机的算法,该算法基于单隐藏层的神经网络结构,并在参数优化方面提出了创新。首先,ELM方法随机初始化了网络隐藏层权值和阈值;接着通过训练数据,建立相应的输入输出方程;最后借助于Moore-Penrose广义逆矩阵理论来求得输出层权值。
考虑一个具有 N 个样本的集合,设单隐藏层网络拥有m个隐藏层神经元,记为输出层阈值向量, f为隐藏层函数, 为输入权重,输入层阈值向量。则单隐藏层网络可构建如下的输入输出方程:
(1)
记
(2)
则该方程可写成矩阵的形式 HB=Y。 之后,極端学习机可以借助广义逆矩阵理论求得相应的权值向量B。
由上述计算可以见得,由于该模型主要依赖于求解线性方程组的理论,相比于传统的误差反向传播算法,极端学习机模型可以成倍地减少运行时间。同时,注意到ELM模型的准确度很大程度上依赖于权值向量W的选取,因此如果当W的选取不当,矩阵B有可能会变得奇异, 从而使得模型精度大幅度降低。因此,修剪多余的隐藏层神经元是一个值得关注的问题。
2.优化极端学习机。为了达到修剪多余神经元的目的, OPELM模型首先利用多稀疏响应回归 (MRSR)算法对隐藏层神经元的重要度进行了排序。之后,借助留一法(LOO)对排序后的模型进行筛选,为了简化运算,我们采用了PRESS准则作为筛选指标:
(3) 其中H为隐藏层权值,D为对角矩阵,其对角元素定义如下:
(4)
3.最小二乘支持向量机。最小支持向量机(LSSVM)是对支持向量机的改进算法,相比于SVM, 该算法拥有更快的计算速度,因此可以用于解决分类、回归等问题,并具有良好的泛化能力。
其算法描述如下:
记l个训练样本,其中代表输入值,代表输出值;
将样本从映射到特征空间中,则估计函数为
(5)
式中: 为加权向量;b 为常值。
根据结构风险最小化原则,求、b 的估计值,有
(6)
约束条件由SVM 中的不等式改为等式约束为
(7)
式中:为惩罚系数,控制对超出误差样本的惩罚程度;为估计误差。
引入拉格朗日乘子,求解该问题,则有
(8)
其中,为拉格朗日乘子。
通过拉格朗日乘数法,可得下述方程:
(9)
消去与,则有
(10)
为解决高维计算问题,利用核函数代替内积计算,则式(10)可转化为
(11)
LSSVM具有非常多的核函数,其中RBF以及多项式函数被研究者广泛的采用。在论文中,我们采用了RBF核函数,并且,LSSVM的主要参数(正则参数c及)通过粒子群算法确定。粒子群算法参数参考文献[16],其中c的变化范围在10-8 到106之间,的变化范围在10-8 到106之间,其余粒子群的参数参表1。
二、残差预测方法
1.基于风功率序列的残差预测模型。已知风功率序列为,首先以风功率为输入、风功率为输出建立Network1,通过对网络训练并预测得预测值
计算相应残差值:
(12)
之后,对于所获得的相对残差序列,再以残差为输入、残差为输出建立Network2进行建模训练。
2.基于风功率及风速序列的残差预测模型。设风速序列为 ,风功率序列为,首先以风速为输入、风速为输出值建立Network1,可得相应预测值; 接着,以风速为输入,风功率为输出建立Network2,可得相应预测值;通过对网络二的预测结果与真实值做差来获得相对残差序列;最后以残差为输入、残差为输出建立Network3。
三、实例分析
本文选取河北省电网内若干典型风电场的全维数据进行特性分析,以承德市2013年1月至2014年11月风电站数据为例分析模型的预测性能,数据采集辨识度为15min。在数据采集过程中,部分缺失数据用NAN表示。我们选用了平均绝对误差(MAE)和相对均方根误差(rRMSE) 作为模型评价依据。其计算公式分别为:
(13)
(14)
模型建立流程参图1。
1.异常数据处理。由于技术局限性,风电场站点中存在部分异常数据。图2显示了某站点风速及风功率数据分布图。其中,X轴为风速数据,Y轴为风功率数据,有图中可以明显看出,当风速接近为0,有部分风功率数据不为0,这明显与实际不符(当风速小于电场的启动风速时,电场实际不发电);此外,部分风功率数据在风速较小时超过了该站点的装机容量,这在实际使用过程中也并不正常。如果不对异常数据进行检测和剔除,将使得样本的质量下降,神经网络的学习受到影响,进而将会导致实验精度的降低。
此外,通过数据统计发现,部分站点中NAN数据过多,从表2可以看出,站点NAN数据比例在10%-30%之间,缺失数据严重的站点可到达40%,这导致数据之间不连贯,数据的规律程度降低。
为此,本文提出了一种切实有效的解决方案:
1.1建立合理的异常值评价措施:(1)对于X正半轴及Y正半轴上的数据进行检测,异常数据标记为NAN;(2)对于取值为负的点,标记为NAN;(3)对于明显超过装机容量的数据,标记为NAN。
1.2如果相邻四个点均为NAN,则从原始数据中剔除此四个NAN值,如果說不全为NAN, 则对该四个点中非NAN的数据进行加权平均,作为该小时的代表值。
2.对比模型。为了增强实验的科学性和合理性,我们采用了BP、PSO-LSSVM和OPELM作为对比模型。其中, BP隐藏层设置为两层,隐藏层神经元个数通过经验公式给出。LSSVM正则化参数由PSO算法计算得出,算法参数参表1。
3.实验结果分析。表3到表6记录了承德市某四个风能发电场详细预测结果,表格7记录了四个站点相对均方根误差。相对均方根误差是风力发电站最重要的考核指标之一,因此下文我们主要以此作为模型评价依据。
根据风力发电系统的需求,风电场功率预测系统提供的实时预测相对均方根误差不超过15%。全天预测结果的相对均方根误差应小于20%。
由表7可以看出,我们所提出来的混合残差模型在短周期预测中显现出良好的精度,均可以达到风力发电要求。在所有的混合残差预测模型中,OPELM+LSSVM表现最优,其rRMSE在1步预测时可以保持在1%以下,1至8步平均相对误差为14.135%,较原始模型有很好的改进。此外,我们可以看到,基于风功率的混合残差模型结果略优于基于风功率与风速的混合残差预测模型,尽管前者利用到了更多的样本信息,但由于风电场数据采集的错误,部分情况下记录下来的风速数据也并不完全准确,因此基于风速及风功率的残差预测模型在使用过程中,可能会出现误差放大的情况,此预测结果也是合理的。
图3分别记录了提前2步、4步、6步及8步预测结果。其中,灰带线代表了当前真实功率上下振幅20%的数值范围。为了增强对比性,图中仅记录了对比模型及两种不同残差预测方法中预测性能最优的两个模型,由该图可以看出,混合残差模型可以很好地跟上风功率的变动,预测值基本落于灰带之间,符合实际发电的需求。 图4 a,c和d记录了在三个站点预测中平均均方根误差,b记载了各模型达到最小mRMSE误差的频率。由图可很明显地看到,混合残差模型的均方根误差小于对比模型,两种不同的残差预测方法在不同的站点中分别达到了误差最小值;两种残差预测方法相比于原始模型有更高的频率达到五個模型中的预测最佳值,两种方法之间并没有明显的优劣之分。因此,在实际使用中本文认为OP+OP+OPLEM或LS+OPELM都具有比较好的预测性能。
四、结语
电能的生产和消耗是同时进行的。准确的风功率预测模型,有利于合理的进行电力系统的规划发展,帮助相关人员合理安排和修订运行计划。这对提高风力发电系统的稳定性、提高发电的经济效益都有着重要意义。本文提出了OP+OP+OPELM 及LS+OPELM 两种不同的混合残差预测模型,此模型较适用于风电场短期预测情形,应用承德市风电场的数据显示,与BP、LSSVM及OPELM 模型相比,新模型具有优越的预测精度及良好的稳定性,适用于风功率短期预测。因此,新型混合模型的提出具有一定的实用性。
参考文献:
[1]廖辉英, 郑世才, 全成文. 基于人工神经网络和粒子群算法的风能预测模型[J]. 微计算机信息, 2012, 10期(10):148-149.
[2]王颖, 魏云军. 风电场风速及风功率预测方法研究综述[J]. 陕西电力, 2012, 39(11):18-21.
[3]郭创新, 王扬, 沈勇,等. 风电场短期风速的多变量局域预测法[J]. 中国电机工程学报, 2012, 32(1):24-31.
[4]冯学军. 最小二乘支持向量机的研究与应用[J]. 安庆师范学院学报:自然科学版, 2009, 15(1):112-113.
[5]张弦, 王宏力. 具有选择与遗忘机制的极端学习机在时间序列预测中的应用[J]. 物理学报, 2011, 60(08): 4-4.
[6]戚双斌, 王维庆, 张新燕. 基于SVM的风速风功率预测模型[J]. 可再生能源, 2010, 04期(04):25-28.
[7]黄庭, 王昕, 李立学,等. 基于小波-极限学习机的短期风电功率预测[J]. 控制工程, 2012, S1期.
[8]Guang-Bin Huang, Qin-Yu Zhu, and Chee-Kheong Siew. Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks, in Proceedings of International Joint Conference on Neural Networks (IJCNN2004):25-29.
[9]Rao, C. Radhakrishna, Mitra, Sujit Kumar. Generalized inverse of a matrix and its applications. Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability 1972; 1:601-620.
[10]Timo Simil¨a and Jarkko Tikka. Multiresponse sparse regression with application multidimensional scaling. Artificial neural networks: formal models and their applications 2005; 3697:97–102.
[11]Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani. Least angle regression. Annals of Statistics 2011; 32:407-499.
[12]G.C. Tiao, R.S. Tsay. Some advances in non-linear and adaptive modelling in time-series. Journal of Forecasting 1994; 13 (2):109–131.
[13]傅美平,马红伟,毛建容. 基于相似日和最小二乘支持向量机的光伏发电短期预测 [J].电力系统保护与控制,2012:65-69.
[14]S.Z. Chamkalani, R. Chamkalani, A. Lohi, A. Elkamel, I. Chatzis Utilization of support vector machine to calculate gas compressibility factor, Fluid Phase Equilib, 358 (2013) 189–202.
[15]J.V. J.A.K. Suykens, Least squares support vector machine classifiers, Neural Process. Lett., 9 (1999) 293-300.
[16]A.Chamkalani, S. Zendehboudi, A. Bahadori, R. Kharrat, R. Chamkalani, L. James, I. Chatzis, Integration of LSSVM technique with PSO to determine asphaltene deposition, J Petrol Sci Eng, 124 (2014) 243-253.