论文部分内容阅读
数据驱动建模是软测量建模技术中的重要方法。由于工业技术的发展,建模对象的非线性和多工况等复杂特性对数据驱动软测量模型的泛化性能提出了更高要求。针对复杂工业过程对象建立具有良好泛化性能和估计精度的软测量模型是软测量技术发展中需要解决的难点问题,机器学习理论在数据驱动软测量建模中的应用为解决这一问题提供了有效途径。为了提高复杂工业过程软测量模型的泛化性能,本文主要研究基于机器学习的软测量建模方法,从基于聚类分析和集成学习的多模型建模以及局部建模等方面提高软测量模型的泛化性能。主要的研究成果如下:1、单模型通常难以描述工况的复杂特性,基于聚类的多模型软测量建模是解决这一问题的常用方法,能有效提高模型泛化能力。由于聚类效果对多模型的估计能力有着重要影响,因此提出一种基于改进仿射传播聚类的多模型建模方法。采用人工鱼群算法对仿射传播聚类算法的偏向参数与阻尼系数进行寻优从而提高聚类精度,聚类之后再通过高斯过程回归算法建立各类样本的子模型。分别用标准数据集仿真和来自实际工业生产装置的现场数据建模仿真,结果表明该方法是有效的。2、聚类多模型软测量建模中,如果数据聚类后类别之间界限不明显,常会出现样本类别误划分和类边界处样本估计不准确的问题,对此提出一种基于支持向量数据描述的聚类多模型软测量建模方法。该方法首先采用仿射传播聚类算法对数据进行类别划分,然后利用支持向量数据描述算法划定类边界从而确定样本与各类别的位置关系,根据样本与各类的位置关系信息从高斯过程回归算法建立的子模型、全局模型和局部模型中选择合适的模型对样本进行估计。由来自实际工业生产现场的数据进行仿真表明该方法提高了多模型的软测量精度。3、为提高对工况复杂的工业过程进行软测量建模的模型泛化能力,提出了基于改进Bagging算法的高斯过程集成软测量建模方法。该算法采用高斯过程回归算法建立集成学习模型的基学习器,并在Bagging算法对训练样本重采样生成基学习器训练子集的基础上,采用基于正则化互信息的特征排序指标进行基学习器的输入特征抽取,实现有监督的特征扰动,从而改善学习器的差异度。对待测样本进行软测量估计时,根据各高斯过程基学习器输出的方差自适应地选择基学习器进行集成输出。以来自实际工业现场反应器的数据进行建模仿真表明了该方法的有效性。4、对于具有较强非线性特点且工况多变的过程对象,建立在线局部模型能够提高软测量模型的泛化性能,因此提出一种用于在线软测量建模的局部加权混合核偏最小二乘算法并做了仿真验证。该算法以多个具有不同特性的单一核函数构成混合核函数,将原始输入映射到高维特征空间,再采用局部加权学习算法在高维特征空间中计算样本权值,并对核变换后的样本数据进行加权处理,然后采用核偏最小二乘的算法步骤建立在线局部软测量模型。