论文部分内容阅读
作为工业过程综合自动化的重要组成部分,故障诊断旨在及时有效地发现并消除故障,对确保生产安全和产品质量具有重要意义。一方面,随着市场竞争的日趋激烈,现代工业过程逐渐变得复杂化和大规模化,获得精确的过程机理模型愈发困难,积累足够的过程经验知识相当耗时。另一方面,集散控制系统、工业物联网、智能仪表等信息技术快速发展,使得能够反映过程状态信息的大量数据被采集和存储,促使基于数据的故障诊断研究成为智能制造时代下过程控制领域的热点之一。故障的检测、溯源、分类是故障诊断的主要研究内容。对于大规模过程的故障检测及溯源,通常采用分布式建模方法;经典的分布式主成分分析方法开创性地采用数据驱动的思路进行子块划分,摆脱了对复杂大规模过程先验知识的依赖,但仍存在一些未引起足够关注的重要缺陷。对于故障分类,传统的故障分类方法通常对训练样本的标记情况进行理想的假定,限制了故障分类模型的实用性。因此,本文分别针对大规模过程的故障检测及溯源问题、训练样本不理想标记情况下的故障分类问题展开研究,提出了以下新方法和新思路:(1)针对大规模过程的故障检测及溯源问题,考虑到经典的分布式主成分分析方法在子块变量的选取、过程数据动态信息的利用、故障溯源的可靠性方面存在一些重要缺陷,本文提出了 一种性能驱动的分布式规范变量分析方法。首先,结合历史故障信息,利用遗传算法,优化大规模过程分块时的子块变量选取;然后,利用规范变量分析捕获过程数据的动态信息,并为各子块建立故障检测模型,实现基于分布式规范变量分析的故障检测;最后,设计适用于分布式规范变量分析的、基于贡献图的故障溯源方法,提高故障溯源的可靠性。(2)针对训练样本不理想标记情况下的故障分类问题,考虑到训练样本在实际标记过程中存在的标记噪声,本文提出了 一种基于流形保持稀疏图的集成判别分析方法。首先,利用流形保持稀疏图过滤训练样本,不仅能够消除明显的标记噪声,而且能够保留更具信息表征能力的训练样本,从而改善训练样本的信息质量;然后,基于Bagging和判别分析,采用集成学习改善故障分类模型的鲁棒性。(3)针对训练样本不理想标记情况下的故障分类问题,考虑到在线样本有可能源于新故障类别,且历史训练样本的信息表征能力有限,本文提出了一种基于在线学习的判别分析方法。该方法基于增量学习进行模型的在线更新。对于在线更新环节,本文设计了合理的在线样本选择标准。一方面,该标准能够通过具有在线更新性质的最大最小偏离度准则,识别源于新故障类别的样本;另一方面,该标准能够通过加权考虑最大后验概率和信息熵,确保被选在线样本的可靠性和信息量。(4)针对训练样本不理想标记情况下的故障分类问题,考虑到实际工业过程只能获取少量标记的训练样本,并且有必要高效地利用有限和高成本的专家标记资源,本文提出了一种基于主动学习的半监督指数判别分析方法。首先,结合大量未标记的训练样本,构建正则化的离散度矩阵,设计适用于半监督场景的指数判别分析方法;进一步地,基于主动学习,采用最优次优类属概率差准则,选择更具标记价值的训练样本交给专家标记,从而实现专家标记资源的高效利用。