论文部分内容阅读
现代工业中,出于对生产过程的安全性、生产质量的稳定性等需求,及时的发现故障并识别出故障类型成为了过程工业中非常重要的一个要求。近年来,随着现代工业流程的不断发展,大量的工业过程数据产生,数据驱动的过程监测算法逐渐成为主流的方法。然而在实际工业过程中,标签数据往往是非常稀缺的,这种现象使得传统的、相对成熟的有监督算法在工业过程上的应用受到了限制。半监督学习因而获得了大量业内学者的关注。然而半监督学习的方法,通常存在着表现不稳定的缺陷。集成学习可以通过一定的规则将各个弱学习器的结果进行整合,得到一个更具泛化性的强学习器。因此,本文针对工业过程标签数据缺失、半监督算法对数据分布有强要求等问题,将半监督学习和集成学习这两类提升算法泛化性的方法相结合,进行了一系列半监督集成学习方法的研究,具体工作包括:(1)为了规避半监督集成学习算法中常见的伪标签误差累积问题,同时尽可能多的利用无标签样本的信息,在费舍尔判别分析、主元分析结合的半监督算法基础上,提出了一种结合度量层融合的半监督集成学习(ESFDA)的故障分类方法。该算法利用主元分析引入数据的全局分布信息,利用度量层融合提高基分类器的泛化性。并且在Tennessee Eastman平台中完成了模型的仿真实验,验证了 ESFDA模型的有效性。(2)为了进一步提升各个基分类器间的多样性,提出了一种基于自适应方法的半监督集成学习(Ada-ESFDA)的故障分类方法。该方法通过自适应的调整迭代过程中下一次训练时有标签数据的权重,提高基分类器间的多样性,同时利用基分类器的分类性能来调整各个基分类器的权重系数,进一步提升了模型的分类准确性。仿真结果证实了 Ada-ESFDA模型的自适应改进对模型分类效果的提升。(3)针对标签样本极度缺失的情况,提出了一种结合主动学习的半监督集成学习(Active-ESFDA)的故障分类方法。通过引入主动学习的方法来为模型训练提供最具信息量的无标签样本,用更少的人工标注代价,获得分类性能更好的模型。最后通过仿真实验进一步验证了 Active-ESFDA模型引入自主学习的有效性。最后,对本文的一系列研究内容进行了总结,并对后续的研究工作进行了展望。