论文部分内容阅读
随着我国电力体制改革的继续推进,电力市场环境将逐步发生变化。未来将有更多的售电主体进入市场。售电公司为了提高自己的核心竞争力,在未来电力市场的占有一席之地,就需要科学地分析未来负荷曲线的特性并且准确进行负荷预测。同时伴随着能源互联网和电力大数据的建设步伐的不断加快、电网规模和电力信息采集量的扩张,客观上对负荷预测精确度和预测算法的运算效率产生了更高的要求。负荷预测在能源互联网的正常运行和调度有着重要的作用,采用电力大数据技术进行负荷预测,使得对海量实时数据、大量的历史同期数据和天气气象数据的综合利用变得更加有效。本文首先针对先进的检测装置和计量设备对负荷的检测时间间隔越来越短,致使负荷数据向着高维度变化,并加大了负荷曲线聚类难度的现状。为了解决这个问题,本文提出了一种使用核方法将数据映射到高维空间中进行聚类,同时采用核主成分分析与缩减矩阵规模对该方法的计算进行优化。阐述了算法改进的依据和相关理论推导。最后进行了实验分析,结果表明聚类数的变化、输出维度对聚类效果的影响,得出改进的聚类算法可以有效地提高负荷曲线聚类的准确性的结论。其次针对能源互联网所带来的负荷数据海量化,导致数据进行负荷训练面临多次重复训练的问题,本文将增量的方法引入到负荷预测中。数据随着时间更新不断产生,并随着时间的推移某时刻的数据的价值会越来越小。一旦对电力负荷建立预测模型,该模型不能随着时间变化而加入最新值,使得预测模型不能反映最新的时间序列信息,从而降低了预测的准确性。为解决该类问题,本文提出一种BP神经网络隐含层节点增删的方法来实现对BP神经网络训练的增量学习。实验表明,该方法通过实现在BP神经网络训练过程中加入最新的数据,提升了处理海量负荷数据的能力和负荷预测准确率。最后本文为了更好地解决电力负荷数据海量化和高维度的问题,结合了最新的研究热点梯度下降的迭代决策树算法,基于大数据Spark平台,建立了基于该算法的负荷预测模型,并与随机森林算法比较分析。实验使用随机森林与梯度下降的迭代决策树分别对负荷数据进行训练。实验结果表明,在负荷预测的精度及运算的效率上梯度下降的迭代决策树相对于随机森林,都具有较好提升。