论文部分内容阅读
如今化工系统具有集成化、复杂性高、变量多、耦合性强等特点,运行过程会产生大量高维、非线性数据。因此,故障诊断的面临的主要挑战是如何从流程工业中的收集的海量高维、非线性过程数据中提取有效信息。解决该问题的主要方法是利用以特征提取技术为主流的数据驱动的故障诊断方法。判别局部保持投影算法(DLPP)隶属于流形学习范畴,该算法不仅可以挖掘位于流形结构上信息,而且可以通过最小化类内流形散布和最大化类间流形散布更好地实现数据可视化和分类,在故障诊断中具有重要的研究意义和应用价值。然而,DLPP在实际应用中遭受着严重的小样本问题,无法直接应用于使用。为了使判别局部保持投影算法更好的应用于故障诊断,我们分析了判别局部保持投影算法产生小样本问题的原因,提出两种解决方法,并对化工过程进行建模,具体内容如下:(1)提出了一种基于舒尔分解正交指数判别局部保持投影(Schur-OEDLPP)的故障诊断方法。该方法不但保留了 DLPP的鉴别分类特性,还通过引入矩阵指数性质克服了 DLPP的小样本问题,同时可以提取到位于零特征空间的重要的鉴别信息。但矩阵的指数计算会使原有矩阵数据数值变得非常大,因此本文使用了 Frobenius范数对矩阵做归一化处理。此外,该方法应用Schur定理对相应的矩阵指数进行分解,可以获得一组准正交基向量,进而解决特征向量的冗余性问题,更好的实现故障分离。(2)提出了一种基于自助采样判别局部保持投影(Bootstrap-DLPP)的故障诊断方法,该方法利用Bootstrap的对抽样方法,对类内数据进行多次重抽样,使类间样本数大于特征数量,克服DLPP的小样本问题。同时一个含有k-nearest-neighbor和k-furthest neighbor连接图被开发,增强投影数据的分离效果,提高故障诊断的准确性。(3)本文使用Akaike信息准则选择 Schur-OEDLPP 和Bootstrap-DLPP两种方法的最优模型阶次,然后,通过基于最大后验概率的贝叶斯判别模型进行故障归类。(4)最后,本文以二维合成数据集和田纳西-伊斯特曼(TE)过程为研究对象,并使用多个案例评估这两种方法在各个方面的性能。实验结果证明,在可视化性能和分类准确性方面,特别是当类别之间的距离分布不均匀时,提出的两种算法优于其他最新的特征提取方法。