论文部分内容阅读
电网负荷预测作为电力系统中的重要环节,提出至今一直被行业内专家重视。从时间序列到机器学习如支持向量机等模型的应用,电网负荷预测取得了显著的进展。然而,随着预测精度要求的提高,数据量的提升,影响因素的增加,传统模型在处理海量负荷预测数据时显现出疲态、无法达到高效,本文尝试将机器学习领域和各大数据挖掘比赛中取得较好效果的eXtreme Gradient Boosting(XGBoost)模型应用在电网负荷预测中,并选第九届电工数学建模A题负荷预测竞赛的某地区真实电荷数据作样本,采用K折交叉验证及网格搜索法进行模型训练,利用平均绝对百分误差、均方根误差、准确率,单点达标率等指标比较XGBoost模型和传统模型的差异。同时本文还将尝试长短期记忆人工神经网络(Long-Short Term Memory,LSTM)在电网负荷预测中的应用。本文对实例2015-01-10日内的每隔15分钟的电网负荷96个样本点进行预测,并利用达标率和准确率两个指标来比较4种模型在单个时间点和整体预测上的精度(其中达标率为单个时间点预测相对误差<3%的点占总预测点的比例;准确率为所有预测点预测结果的误差率,其中准确率≥94%表示整体预测合格)。随机森林回归(RandomForest,RF)预测样达标率为 31.25%、准确率为 92.42%;梯度增强回归树(Gradient Boosting Regression Tree,GBRT)预测样达标率为57.29%、准确率为96.48%;LSTM预测样达标率为88.54%、准确率为98.04%;XGBoost预测样达标率为85.42%、准确率为98.05%。XGBoost模型相对于传统GBRT模型达标率提升28.13%,准确率提升1.57%,说明XGBoost对波动明显的单点有更好的拟合能力。同时LSTM模型也表现出了较好的拟合能力,是今后电网负荷预测的一个发展方向。但由于深度学习目前运行设备成本高、且相对树模型更为黑盒可解释性低,不利于业务人员理解。而XGBoost模型属于浅层学习,不仅对硬件设施要求低、运行速率快,而且预测精度高。XGBoost模型是目前较符合电网超短期负荷预测发展趋势的具有实用性和应用前景的算法。同时本文还研究了不同的特征维度对电网负荷预测的影响,即多维度下的电力系统负荷预测。(1)、只考虑时序特征的XGBoost模型(Single-XGBoost,S-XGBoost)达标率为44.79%、准确率为 96.26%;(2)、单增加温度因素的 XGBoost 模型(Temperature-XGBoost,T-XGBoost)达标率为95.84%、准确率为98.61%;(3)、单增加湿度因素的XGBoost模型(Humidity-XGBoost,H-XGBoost)达标率为 83.33%、准确率为 97.89%;(4)、单增加降雨量的 XGBoost 模型(Rainfall-XGBoost,R-XGBoost)达标率为 64.58%、准确率为 96.44%;(5)、温度、湿度、降雨量综合考虑的多维度XGBoost模型(Multi-dimensiona-XGBoost,M-XGBoost)达标率为85.42%、准确率为98.05%。从预测点达标率和准确率分析,T-XGBoost模型预测达标率分别优于H-XGBoost模型12.51%、R-XGBoost模型31.26%;准确率方面T-XGBoost模型比H-XGBoost模型高0.72%、R-XGBoost模型2.17%,证明温度因素对电网负荷预测影响突出。同时T-XGBoost模型预测达标率优于M-XGBoost模型10.42%,准确率方面T-XGBoost模型准确率比M-XGBoost模型准确率高出0.56%,表明机器学习中特征因素并不是越多越好,当特征项存在相关性过高的冗余因素时模型预测精度会降低。