论文部分内容阅读
电力行业大数据发展白皮书的发布标志着中国电力工业迎来大数据时代,而大数据带来的是新的智能化生产方式。众所周知,现阶段已有的机组运行优化系统难以解决运行参数间的耦合问题,完成对电厂复杂热力系统结构的最优控制,因此本次研究引入数据挖掘技术,对电厂SIS系统中庞大的运行数据进行分析,从中寻找新的运行优化控制方案,保持机组的最佳运行状态,从而提高机组的安全性与经济性。本文依托于贵州大唐发耳发电有限公司仿真机项目,从电厂的SIS服务器中取得了研究所需的运行数据,同时参与电厂SIS系统的升级改造,研究了数据存储及传输的关键技术,保证了数据导出时的准确性,为后续的研究打下了良好的基础。随后给出的基于拉格朗日插值和GARCH模型的组合预测模型,是为了完成对数据的预处理,这是数据挖掘过程中非常重要并占用大量时间的阶段,神经网络组合器可以利用GARCH模型对数据波动性的良好反应来克服拉格朗日插值的龙格现象,同时利用拉格朗日插值的快捷运算提升整体数据预处理的速度。基于序列模式的供电煤耗保护关联(CCPC)算法是本文的核心内容,算法的设计思想来源于上海交大的马进、金茂菁等提出的隐私保护多步攻击报警关联(PPMAC)算法,以全面反映机组经济性的供电煤耗为优化目标并据此划分时间序列,将不同时间序列中的运行参数变化引起的供电煤耗上升或下降视为对供电煤耗的攻击或保护,通过序列模式挖掘,不断学习记录攻击保护场景,攻击预防与保护相结合来达到降低供电煤耗的目标,提升机组实际运行管理水平。最后利用统计分析领域享有盛誉的SPSS Clementine对CCPC算法完成了仿真实验,得到了所需的预测结果,验证了CCPC算法的可行性。