论文部分内容阅读
电站信息技术的大力发展,为基于数据驱动的运行优化研究提供了良好的平台,其中,基于电站实时/历史数据库中海量数据对复杂热力系统建模的方法已逐渐成为研究的热点课题之一。然而,运行数据不同于试验数据,有着许多不利于建模的特点,例如,变量间存在多重相关性、工况组合分布不均匀、过程存在非线性等,这些问题都严重阻碍着历史数据建模方法的发展和应用。针对这些问题,本文研究了基于偏最小二乘理论(Partial Least Squares projection to latent structures, PLS)的热工过程建模方法,较好地解决了上述问题。论文的主要内容和研究成果包括:1.分析了电站历史数据的特点,总结了基于历史数据建模方法的三个阶段,即数据准备、数据建模和模型验证。介绍了历史数据的常用预处理方法,常用的建模理论以及模型检验方法,阐述了拟合精度与预测精度的区别。2.回顾了PLS方法的发展历史及研究现状,介绍了PLS以特征提取思想解决变量间多重相关性的过程,并给出了利用交叉有效性确定提取成分个数以及PLS模型的常用辅助分析方法,最后总结了PLS的非线性建模方法。3.针对电站历史数据分布不均匀的特点,提出了建模样本选择的三点原则。借鉴于试验建模方法具有优质建模样本的思想,提出了以试验设计原理选择建模样本的方法。在分析比较了几种常见的试验设计方法后,确定了以均匀设计作为建模样本的选取原则,并给出了该方法的详细实现过程。最后通过仿真分析验证了建模样本均匀性对于提高模型精度的意义。4.以均匀设计为原则的建模样本选择方法在应用到实际热工过程时,会因变量间的多重相关性导致无法获得所要求的数据,针对这一问题,提出了先对原始数据进行PLS特征提取再进行均匀选择的方法,并分析了该方法的有效性。随后在此方法的基础上,提出了对原始数据进行正交信号修正(Orthogonal Signal Correction, OSC)的改进方法,进一步保证了均匀建模样本数据的获取。5.以热工过程中的再热汽温系统为例,介绍了基于历史数据的PLS建模方法应用过程。从能量平衡的原理出发,提出了以再热期望焓升(即单位流量蒸汽吸热能力)作为因变量的再热汽温建模方法,并对其影响因素进行了全面的定性分析,构建了火焰中心高度、入炉煤质等现场没有引入但却有着关键作用的中间变量。通过多组模型对比的方式验证了:1)以再热期望焓升作为因变量建模能有效地减轻再热汽温模型中的非线性成分,较好地反映汽温变化的本质;2)以均匀设计为原则的建模样本选择方法能有效地提高模型的预测能力。最后,给出了基于所建模型的再热汽温运行优化指导。