论文部分内容阅读
系统是否处于稳态是对系统进行研究时最基础和常见的假设,直接关系到后续对系统进行控制和优化的方法。随着过程工业的发展,实际的生产过程中系统和生产方式都趋于复杂化,系统整体表现为多变量、非线性和时变性等特点。如何在复杂过程系统的历史数据中找到系统处于稳态的时刻,并且析取各个稳态下对应的工况就显得更加重要。本文从数据驱动的角度出发,结合传统的稳态检测方法和统计学习算法思想,研究了复杂过程的稳态检测以及稳态工况数据提取的方法。针对复杂过程的多变量特征,将统计学习和数据挖掘领域的主元分析法、聚类以及核密度估计等算法应用于稳态检测中,并以典型的单元装置精馏塔仿真模型数据和发电机组锅炉对象的实际数据为实例进行了算法验证和性能分析。本文的主要内容和创新点包括:针对基于统计分析的稳态检测方法,在基于F检验的单变量算法的基础上,提出一种基于主元分析法(PCA)的多变量F检验改进算法,将原算法的适用范围拓展到多变量领域。仿真实例表明该改进方法比现有的基于单变量稳态合成的多变量稳态检测算法准确且具有较好的抗干扰能力。在系统稳态数据符合高斯假设的基础上,提出了不同稳态下多变量复杂系统数据表现为均值不同的高维高斯分布的假设,从而可以将多变量系统的稳态检测问题转化为以稳态工况为中心点的聚类问题。在此基础上,提出了联合层次聚类和时序判据的多变量稳态检测方法,以及聚类阈值最优值的确定方法。通过精馏塔机理模型数据验证了方法的有效性,该方法无需预先进行变量挑选和聚类阀值选取,可以直接计算。在维度不同的数据上的实例分析表明,该算法复杂度不随着数据维度增加而增加。针对如何获取稳态工况的问题,在稳态检测算法的基础上,引入了核密度估计(KDE),通过估计数据概率分布情况来求取区间内的稳态工况,可以准确地获取数据集中蕴含的多个稳态工况,并且可以有效地克服由于稳态检测算法的偏差而导致的非稳态数据干扰。针对核密度估计在高维度数据集上计算量复杂求解困难的不足,提出了基于PCA的降维-重构方法,从而减少算法复杂度,仿真结果表明基于PCA降维-重构方法在减少计算量的同时依然满足准确度的要求。在精馏塔模型数据仿真的基础上,针对发电机组锅炉对象的实际对象数据集,对本文提出算法的三个特点:基于聚类的稳态检测、基于KDE的工况数据提取和基于PCA的降维加速计算算法进行了性能验证。