大数据下风电场混合算法建模研究

来源 :哈尔滨理工大学学报 | 被引量 : 0次 | 上传用户：baobeidjlj

【摘要】

：

【作者】

：

郭敏　赵巧娥　高金城　周斌龙

【出处】

：

哈尔滨理工大学学报

【发表日期】

：

2019年1期

【关键词】

：

大数据风电场粒子群优化算法 K-MEANS聚类算法建模 big datawind farmparticle swarm optimization algo

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：利用优化粒子群K means混合聚类算法分析大规模风电场的实际运行数据并对其建模。以山西盛风岭风电场作为实例，在大数据下依据其实际运行数据建立风速-功率模型并利用优化粒子群K means混合聚类算法（IPSO K means）进行模型优化。结果显示，对比方法（传统方法、K means、PSO K means）的平均误差分别为46 29%、18 58%、17 30%，而IPSO K means方法的平均误差为14 11%，说明所提方法可以大大提高模型的准确性。
　　关键词：
　　大数据;风电场;粒子群优化算法;K means聚类算法;建模
　　DOI：10 15938/j jhust 2019 01 008
　　中图分类号： TM614
　　文献标志码： A
　　文章编号： 1007-2683（2019）01-0048-07
　　Application of Hybrid Algorithm with Large Data in Wind Farm Modeling
　　GUO Min，ZHAO Qiao e，GAO Jin cheng，ZHOU Bin long
　　（Department of Electric Power Engineering， Shanxi University， Taiyuan 030013， China）
　　Abstract：The real operation data of large scale wind farm are analyzed and modeled by using the optimized particle swarm K means hybrid clustering algorithm Shanxi Sheng wind ridge wind farm as an example， in the era of big data on the basis of the actual operation data to build wind power model and the optimization of particle swarm K means hybrid clustering algorithm （IPSO K means） is used to optimize the model The results showed that the comparative method （traditional method， K means， PSO K means） the average error is 46 29%， 18 58% and 17 30% respectively， while the average error of IPSO K means is 14 11% The results show that the proposed method can greatly improve the accuracy of the model
　　Keywords：big data; wind farm; particle swarm optimization algorithm; K means clustering algorithm; modeling
　　0引言
　　要想準确描述并解决大规模风电场并入电网存在的诸多问题，必须建立准确的风电场并入电网的外部输入特性，即风速-功率模型[1-2]。然而，风电场所处环境复杂，风机排布不规则且风速变化没有规律，传统描述风电场外部输出特性的建模方法已不再适用[3-5]。随着大数据时代的到来，大数据正在以前所未有的方式影响和改变风力发电的研究现状[6-7]。通过聚类分析风电场测得的大量实际运行数据建立风速-输出功率模型引起越来越多的人关注[8-9]。文[10-12]基于风电场实际运行数据利用K means聚类算法进行风电场等值模型建立，虽然利用实际运行数据建立模型更加接近风电场的实际运行状况，但是由于K means聚类算法求取的聚类结果很容易受聚类中心的影响，所以得到的风速-功率模型并不太理想。
　　本文在总结现有文献的基础上，考虑K means聚类算法选取不同聚类中心对风电场建模准确性的影响，避免粒子群优化算法（particle swarm optimization algorithm，PSO）陷入局部最优聚类[13-14]，将优化粒子群K means混合聚类优化算法（improved particle swarm K means hybrid clustering optimization algorithm，IPSO K means）应用到基于实际运行数据的风电场建模当中，避免K means聚类中心不易选取、难以实现最优聚类以及地理环境因素复杂、风电机组分布不均等因素对建立风电场模型的影响，从而建立更加接近实际运行状况且满足实际工程需求的风电场模型。
　　1大数据下风电场的风速-输出功率模型
　　虽然大数据时代下的风电场可以快速存储大量相关运行数据，但是风力发电机组的输出功率与风机捕获的风速息息相关，因此忽略其它次要因素不考虑，可以将风力发电机组看成是一个二端口原件，即输入量是风速，输出　　量是发电功率[15]，关系如式（1）所示（1）
　　其中： P 为风机（风场）输出功率; v 为风机捕获（风场等效）风速。
　　实际风电机群运行的风速-功率点呈条带状分布在风机出厂试验测得的风速-功率曲线两侧[16]，并不能反映整个风电场的风速-输出功率特性。而我们需要一条能够反映整个风电场等效风速和输出功率特性的曲线，即将风速 v等分成n个区域，那么各个区域的宽度为
　　Δ v=v  max -v  min n（2）
　　其中：v  min 对应切入风速;v  max 对应切出风速。
　　将区间[v  min ，v  max ]等分为[v  min ，v 2，v 3，v 4，…v i，…，v n，v  max ]，令第i个区间为[v i，v i+ △ v]，那么在第i个区间内的实测输出功率、风速的均值如下：
　　P- i=1N i∑N ij=1P i，j （3）
　　v- i=1N i∑N ij=1v i，j （4）
　　其中：P- i、v- i分別为第i个区间内的平均输出功率、风速;N i为区间i中实测数据的个数。
　　同理，计算每个区间的均值，即可得到多个风速-输出功率的均值点，即（v- 1，P- 1），（v- 2，P- 2），…，（v- n，P- n），利用最小平方法拟合均值点，便可得到一条能够代表整个风电场等效风速和输出功率特性的曲线[17]。
　　2K means聚类算法
　　目前，基于风电场实际运行数据按照风电场的风速对机组进行聚类划分的常用建模方法就是K means聚类算法[10-12]。K means聚类算法的核心思想是依据实际测得不同风电机组的时间序列风速数据，按照相似性将风电机组划分到预先设定的K个聚类中。K means聚类算法应用到风电机组聚类划分的原理具体阐述如下：
　　1）随机从风电场采集的机组运行数据中选取k台风机的实际运行数据作为初始聚类中心;
　　2）按照采集的其他风机的实际运行风速数据计算他们与1）中初始风机聚类中心的距离并按照最近原则将它们划分到与其距离最小的一类中;
　　3）将分类中包含风电机组实际运行风速数据进行平均计算处理，得到新的风机聚类中心;
　　4）重复2）、3）步骤，直到风电机组各个聚类中的聚类中心不再发生变化，那么依据风电机组实际运行风速数据进行聚类划分完成。
　　其中，利用高斯距离对风电机组实际运行风速数据的相似性进行度量，其计算公式如（5）式所示：
　　D（i，j）=∑dg=1（v ig -v jg ） 2（5）
　　其中，D（i，j）表示高斯距离，i=（v i1 ，v i2 ，…，v id ）和j=（v j1 ，v j2 ，…，v jd ）是任意两台风机的d 维数据对象。而聚类中心是由每类所含风机数据的均值表示的。其原理如图1所示：
　　利用K means聚类算法对风电机群进行聚类划分，求取等效风速如式（6）所示：
　　v eq =1m∑kn=1v G n ，I t z n=∑kn=1ω nv G n （6）
　　其中，m为风电场投运机组数;k为机组聚类数;n为第n类机群;v Gn 为第n类机群的代表风速;I t z n 为第t z次聚类完成后且第n类机群所含I台风机;ω n为v Gn 在整个风电场等效风速v eq 中的权重系数。其计算公式如式（7）所示：
　　ω n=I t z nm（7）
　　将v eq 代入到（1）式即可得到整个风电场的输出功率[18]，如式（8）所示：
　　P eq =m×f（v）=m×f（v eq ）（8）
　　但是K means聚类算法也有不足的地方：1）聚类中心比较难确定，是随机选取的，而聚类中心的选取对聚类结果影响很大;2）容易得到次优解。可见，K means聚类算法虽然在风电场建模中得到了应用，但是仍需改进。
　　3IPSO K means聚类算法
　　为了解决利用K means算法建立风电场模型的不足，本文通过将惯性权重值、学习因子和权衡系数被控制后的粒子群算法[19-20]与K means聚类算法混合重组，不仅克服了K means算法的不足，而且通过权衡系数控制粒子的更新速度，使粒子群算法的整体搜索性和局部探测性表现地更好，避免K means算法提前局部收敛，得到次优聚类结果，最终实现全局最优聚类。假定任一粒子下一时刻的移动速度如式（9）所示：　　v ′ d（t+1）=κ（ωv d（t）+c 1×rand（）×（p d（t）-
　　x d（t））+c 2×rand（）×（p gd （t）-x d（t））），
　　κ=21-ρ-ρ 2-4ρ，ρ>0.62（9）
　　其中： v ′ d（t+1）表示任一粒子在维度d上下一时刻的速度;x d（t）表示任一粒子在维度d上t时刻的位置;w为惯性权重;p d（t）为任一粒子当前搜索到的最优解;p gd （t）为整个粒子群当前的最优解;c 1、c 2表示加速系数，可以改变p d（t）与p gd （t）的相对重要性; rand （）为随机数，取值一般在0到1之间。式（5）中常数κ能对惯性权重值、学习因子进行权衡，避免加速系数c 1、c 2过增，避免粒子更新偏向粒子局部或粒子整体，同时也避免了速度过增，使粒子群算法表现出更好地搜索性和收敛性还不增加计算量。粒子移动的下一位置公式为v ′ d（t+1）=x d（t）+v d（t）。
　　3 1算法的关键技术及编码原理
　　粒子群中的每个粒子都可以理解为风电机组在空间进行聚类划分的一个可行解集，而聚类算法主要处理的问题是找出风电机组满足条件的聚类中心并对其它机组进行聚类划分。因此，可将每台风电机组的运行时间序列风速数据映射为粒子群中的粒子，即用 k台风机的运行风速数据作为聚类中心组成向量Z j（1≤j≤k）来表示粒子的位置x i 。另外，用IPSO K means聚类算法给风电机组进行聚类划分时，需要适应度函数作为风电机组聚类划分好坏的评价标准。设定风电机组实际运行数据为 V=（v 1，v 2，…，v m），利用IPSO K means聚类算法划分 k类，用Z j表示每个聚类的聚类中心，那么衡量聚类效果好坏的适应度函数就表示为
　　f（x）=∑kj=1∑‖v i-Z j‖ （10）
　　通过适应度函数值可以得到不同风电机组实际运行数据的相似度值，适应度函数值越小，说明风电机组实际運行数据越相似，从而得到的聚类结果越准确。因此，IPSO K means聚类算法的关键技术在于找到每台风机潜在的那个位置使其适应度函数值最小，而此时风机所处位置距离最小的聚类中心即为优化所得结果。
　　把已生成粒子所在的位置即 k 个聚类中心、适应度和速度作为聚类中心的编码结构生成编码。风电机组的实际采集运行风速数据可以表示为d维向量，那么不同风电机组实际运行风速数据映射的粒子的位置和速度可以用 d×k 维变量表示。因此算法编码如表1所示。
　　3 2算法流程
　　IPSO K means聚类算法首先必须对风电机组实际运行数据进行初始化，即随机的对风电机组实际运行数据样本进行聚类划分，并赋予粒子位置初值。然后循环计算不同粒子的适应度函数值，形成初始粒子群。在初始粒子群的基础上，由每个粒子的适应度函数值来更新它们的速度和位置。最后，对形成新的粒子作K means聚类优化。其算法的方框流程如图2所示：
　　4实例验证
　　以盛风岭地区某风电场为例进行分析，该风电场分为东西两个区域，东部区域主山脉基本为东西走向，支脉为西北至东南走向，山脉总长约12 2.km，平均海拔高度在1693～2119米之间。风电场地理环境复杂，植被覆盖较少，场址中心位于东经114°～116°，北纬39°～41°之间，一、二期共有66台机组，总装机容量99.MW，风电场风机布置图如图3所示：
　　实际运行当中的风电机组并不按照风机厂家实验测得的标准风速-功率曲线运行，而是风电机组大量的风速-功率点呈条带状分散在标准曲线的两侧，如图4所示：
　　本文选取盛风岭风电场2016年7月14号11：00：00到2016年9月14号10：40：00的风机实际运行数据进行分析，得到基于实际运行数据的风电场风速-输出功率曲线如图5所示：
　　利用优化粒子群K means混合聚类算法对以上风电场的实际运行风速数据进行聚类划分并将最终结果与K means、PSO K means混合聚类结果比较，如表2所示：
　　通过表2可以看出，不同方法对风电机组聚类划分具有不同的优缺点，K means算法所选聚类中心不同，聚类结果不同（此处只列出选取两种不同聚类中心所对应的聚类结果）;相比较PSO K means算法，虽然聚类结果不再受聚类中心选取的影响，但容易得到次优聚类结果;而IPSO K means聚类结果不再受聚类中心选取的影响，通过权衡因子的协调可以保证最优聚类。由于风的随机性、间歇性和不确定性，不规则的分布在环境复杂的山岭地区风电机组所捕获的风速差别很大，即相邻机组的风况可能差别很大，而相距很远机组的风况也可能很相似。可见，依据邻近原则划分风电机组建模并不能够准确反映实际风电场的运行状况。另外，K means聚类算法不同的聚类中心导致聚类结果不同，且聚类结果差别很大;通过PSO K means混合聚类算法，可以克服选取不同聚类中心对最后聚类结果的影响。但是如图6所示。　　从图6可以看出，PSO K means混合聚类算法的收敛性并不是太好，很容易得到次优聚类结果，所以提出IPSO K means混合聚类算法，弥补PSO K means混合聚类算法的不足。
　　通过K means、PSO K means以及IPSO K means聚类算法求得的等效风速 v eq 带入到（1）式中，便可得到风电场的等效输出功率 P eq =n×f（v）=n×f（v eq ）。将不同方法求得的风电场等效模型输出功率曲线与实际风电场输出功率曲线进行比较如图7所示，并分别计算不同方法求得的风电场等效功率与实际风电场输出功率之间的误差，如图8所示：
　　通过分析不同方法求得的风电场等效模型输出功率与实际风电场输出功率之间的误差对比曲线如表三所示：
　　从表3可以看出，传统方法建立模型的最小百分误差0 46%，最大百分误差175 81%，平均百分误差46 29%。显然，传统方法已然不再适用于大数据时代下运行更复杂、影响因素更多的风电场建
　　模。而本文在PSO K means聚类算法建立模型的基础上，利用IPSO K means聚类算法建立等效模型的最小百分误差0 40%，最大百分误差46 26%，平均百分误差14 11%。
　　从上述实例分析数据结果可以看出，与传统建模方法相比，利用K means聚类算法建模考虑到风电机组之间的风速差异、风电场所处环境的复杂以及各机组之间互相影响的作用，聚类划分建立的风电场风速-功率模型可以避免上述各个因素对模型准确性的影响。而采用IPSO K means聚类算法对风电场的风电机组进行聚类划分，克服了聚类中心难以选取，聚类结果随聚类中心选取而变化的难题，相对于本文所提及的其他算法，IPSO K means算法通过聚类划分求得代表整个风电场的风速-功率外部输出特性等效模型更能反映实际运行状况，模型的准确性有了很大的提高。
　　5结论
　　本文根据实际风电场采集的数据，利用IPSO K means聚类算法对风电机组进行聚类划分。IPSO K means聚类算法可以依据风电机组的实际运行数据对其进行准确聚类划分，能够建立更加准确的代表整个实际风电场的风速-功率输出模型。通过实例分析，IPSO K means聚类算法可以根据风电机组实际运行数据对其进行准确聚类划分。通过IPSO K means聚类算法对风电机组聚类划分建立能够代表整个风电场的风速-功率输出模型更加接近实际运行状况。
　　其次，从实例分析结果可以看出，传统建模方法已经不适用于大规模风电场并网建模;K means聚类算法受聚类中心选取影响严重，建立的模型准确性不太理想;PSO K means聚類算法容易陷入局部最优聚类，出现较大的模型误差。而IPSO K means聚类算法克服了以上算法存在的不足，实现更为合理的风机聚类。
　　最后需要指明的是，虽然利用IPSO K means聚类算法得到的模型更加接近实际运行状况，但是模型的精确度并不是很高。究其原因，主要是依据风电机组实际运行数据建立整个风电场的风速-功率模型，其准确性与实际采集的数据质量息息相关。而大数据下的风机实际运行数据样本容量大，结构复杂，异质数据对建立模型准确性的影响不容忽视，如何避免异质性数据对利用风电机组实际运行数据建立准确模型的影响有待进一步深究。
　　参考文献：
　　[1]陈凡，卫志农，张小莲，等. 计入风速与风电机组故障相关性的风电场可靠性建模及其应用[J]. 中国电机工程学报，2016，11：2900.
　　[2]夏安俊，鲁宗相，闵勇，等. 双馈异步发电机风电场聚合模型研究[J]. 电网技术，2015，7：1879.
　　[3]葛江北，周明，李庚银. 大型风电场建模综述[J]. 电力系统保护与控制，2013，17：146.
　　[4]张元，郝丽丽，戴嘉祺. 风电场等值建模研究综述[J]. 电力系统保护与控制，2015，6：138.
　　[5]陈继明，王辉，仉志华. 双馈风电场等值准确度研究[J]. 电网技术，2014，7：1867.
　　[6]赵宇思，吴林林，宋玮，等. 数据挖掘方法在新能源发电中  的应用[J]. 华北电力技术，2015，10：47.
　　[7]张少敏，毛冬，王保义. 大数据处理技术在风电机组齿轮箱故障诊断与预警中的应用[J]. 电力系统自动化，2016，40（14）：129.
　　[8]郭志，陈洁，黄净，等. 基于改进遗传KM聚类算法的风电场机群划分方法[J]. 可再生能源，2016，2：238.
　　[9]林俐，潘险险. 基于分裂层次半监督谱聚类算法的风电场机群划分方法[J]. 电力自动化设备，2015，2：8.
　　[10]刘步中，张曦煌. 基于模糊聚类的含风电场发电系统可靠性分析[J]. 电网与清洁能源，2016，7：138.
　　[11]沈清野，沈清坤，秦本双. 基于聚类-实测风功率曲线的风电场等值模型研究[J]. 黑龙江电力，2016，2：114.
　　[12]丁坤，吕清泉，蔡旭，等. 采用样板机法计算风电场弃风电量的实测数据统计分析[J]. 可再生能源，2016，1：56.
　　[13]吴荣. 基于粒子群算法的双馈风电场模型参数辨识[J]. 电子测试，2014，5：41.
　　[14]武良，许晓峰，佟金锴，等. 基于混合粒子群算法的风电场无功优化调度[J]. 沈阳工程学院学报（自然科学版），2015，4：6.
　　[15]王海明，韩肖清，田建艳，等. 考虑实际运行数据的风电场稳态建模[J]. 电力系统及其自动化学报，2016，9：27.
　　[16]杨茂，熊昊，严干贵，穆钢. 基于数据挖掘和模糊聚类的风电功率实时预测研究[J]. 电力系统保护与控制，2013，1：1.
　　[17]饶日晟，叶林，任成，等. 基于实际运行数据的风电场功率曲线优化方法[J]. 中国电力，2016，3：148.
　　[18]王钤，潘险险，陈迎，等. 基于实测数据的风电场风速-功率模型的研究[J]. 电力系统保护与控制，2014，2：23.
　　[19]程加堂，熊燕，罗瑞. 基于模拟退火粒子群算法的风电场短期风速预测[J]. 可再生能源，2014，4：485.
　　[20]张炜. 基于改进粒子群优化算法与风速分布回归函数法的复杂地形风电场优化布置方法[J]. 水电能源科学，2016，1：190.

其他文献

新时期高校辅导员队伍建设刍议

随着社会主义市场经济的不断深入和高等教育大众化的全面推进,高校的学生工作面临着许多新的课题。在开展思想政治教育的过程中,辅导员既是学生成长、成才的指导者、引路人,

期刊

辅导员思想政治工作队伍建设

新型荧光试剂显现黑色纺织物表面潜血足迹技术研究

目的研究新型荧光试剂显现黑色纺织物表面潜血足迹技术;方法利用JY-Fluorescent溶解于酒精形成显现工作液,喷涂在遗留在5种常见纺织物潜血足迹部位;结果经新型JY-Fluorescent

期刊

法庭科学JY-Fluorescent荧光试剂潜血足迹纺织物

以“趣”激学的小学语文阅读教学

阅读是语文知识学习必不可少的能力,是语文基本功之一,也是提高小学生文学素养的重要途径。阅读教学对于语文学习和其它学科的学习具有十分重要的作用。因此,对学生阅读兴趣

期刊

小学语文阅读教学阅读兴趣

大数据下风电场混合算法建模研究

其他学术论文