论文部分内容阅读
随着现代工业的不断发展,对生产过程的控制与产品质量的要求越来越高,对生产中过程变量的在线精准监测便显得格外重要。但在很多情况下,一些变量测量所处条件较为恶劣,利用实体传感器直接测量会发生测量滞后或传感器损耗造成的成本过高等问题,为此软测量技术应运而生,它的核心思想为构建过程中易于测得的过程变量与待测量的质量变量之间的数学模型,对待测变量进行在线估计。而随着工业过程中积累的数据逐渐增多以及统计学习理论的发展,基于数据驱动的软测量模型以模型训练简单,迭代更新速度快等优点逐渐成为了研究热点。然而它在实际工业过程应用中仍面临着很多问题与挑战,如过程数据的动态性,非线性,数据存在噪声,有标签样本稀少等问题亟待解决。同时随着人工智能技术的发展,深度学习网络的特征表征能力以及一些复杂机器学习模型的泛化能力愈发增强,本文通过深度网络搭建可迁移动态特征提取器,并提出将特征向强泛化能力模型迁移的策略,针对过程动态性,非线性,数据存在噪声,有标签样本稀少以及复杂模型在工业现场落地应用难等问题展开了研究,本文的主要研究内容如下:(1)针对过程动态性及非线性,基于门控循环单元及编码解码网络提出了无监督的深度可迁移动态特征提取器及基于深度动态特征迁移的集成树软测量模型。模型所提取的动态特征为特征提取器的编码向量,并通过理论推导说明动态特征本质上为在解码网络监督下的序列样本交叉与非线性变换,以保证动态特征对回归器有积极作用,同时将无监督的动态特征向泛化能力较强的集成树模型上迁移,兼顾了深度网络的特征提取能力及强回归器的泛化能力,有效地提升了软测量模型的预测精度。(2)针对过程数据存在噪声的问题,提出了鲁棒动态特征提取器及基于鲁棒动态特征迁移的集成树软测量模型,即在原始动态特征提取器基础上增加了有监督的可以用于指示噪声的注意力机制网络,并利用能够反映噪声强度的注意力机制权重分布构建衰减因子,针对回归器为集成树模型的情形,利用衰减因子对动态特征进行平滑以削弱受噪声影响的动态特征对回归器所起的作用,实验结果表明该模型在无噪声数据集上可以进一步改善模型预测精度,在有噪声数据集上可以减弱噪声对效果的影响。(3)针对过程数据标签样本稀少的问题,提出了半监督动态特征提取器及基于半监督动态特征迁移的集成树模型,由于鲁棒动态特征提取器由有监督和无监督两部分网络构成,故在此基础上进行了改进,模型确定了样本有标签和无标签序列的划分规则,并控制不同序列在网络中的流向对有监督和无监督两部分进行协同训练,使得无监督动态特征提取器受到标签的监督,而有监督部分可以利用无标签样本,实验表明在有标签样本缺失情况下该模型可以有效利用无标签样本信息,预测精度较有监督模型有明显提升。(4)针对复杂数据驱动模型在实际工业过程中落地应用难的问题,提出了工业大数据分布式解析平台,简称MCBDA,该平台由云服务端,工业现场端,客户端及监控端四部分组成,其中云服务端包含用于配置子集群的负载均衡器,分布式数据库,分布式并行模型库,而模型库为MCBDA的核心,它采用三层架构设计,分布式并行算子层,基模型层以及定制化模型层,且高层级模型均可由低层级模型组合搭建并自动形成算法接口,使构建复杂模型的分布式形式十分简单,同时设计了 MCBDA的软件原型系统,实现了定制化的基于动态特征提取的集成树软测量模型,并形成了模型接口供工业现场调用。