论文部分内容阅读
随着工业企业信息化程度的不断提高,其生产过程中积累了大量的数据,这些数据蕴含着生产过程中的重要信息,利用其对工业过程变量进行准确的预测可以为工业生产过程运行提供有益指导。然而现有的预测方法对高噪声、高非线性、高耦合度、含缺失值的工业数据适用性较差。对此问题,本文利用生产过程中积累的大量数据,研究了基于深度学习的工业过程变量预测方法,具体研究内容如下:针对工业数据噪声高、非线性强的特点,提出一种基于深度去噪核函数的最小二乘支持向量机预测模型。该模型通过逐层堆叠多个核函数形成深度核函数网络,代替最小二乘支持向量机中的浅层核函数,提取样本数据中的深度特征以应对其高非线性问题。为了提高模型对含高噪声数据的拟合性能,将去噪算法融入到深度核函数网络的训练过程中,并在预训练每一层网络后通过反向传播算法对深度网络的参数进行微调。通过深度去噪核函数,提高了最小二乘支持向量机对高噪声、高非线性数据的建模能力。面向工业时间序列长期预测问题,提出一种基于粒度计算的深度学习长期预测模型。通过设计一种深度粒度化网络,可以自适应确定每个粒度的起始点和终止点,从而得到数据样本不等长基本信息粒度。采用基于部分重叠分块基矩阵的深度稀疏编码特征分解方法,将不等长粒度逐层分解为基矩阵和系数矩阵的乘积。通过对系数矩阵的预测,并从特征空间映射回原始数据空间得到长期预测结果。考虑工业时间序列存在缺失值的情况,提出一种基于深度双向回声状态网络的不完整数据集预测模型。为了避免缺失数据填补过程对数据本质信息的改变,设计了基于双向融合储备池的深度网络,提取不完整输出数据样本和不完整输入数据样本过去时刻和将来时刻的深度双向特征。基于提取出的深度特征,构建了一个双向回声状态网络完成预测,并通过无监督微调和有监督微调提高模型的预测精度。针对工业关联时间序列区间预测问题,提出一种基于注意力机制和深度网络的关联时间序列区间预测模型。该模型采用基于时间的自注意力机制和基于多因素的软注意力机制,获得因素变量对关联变量影响的重要程度。考虑到因素变量对关联变量的时序影响关系,设计了一个基于深度双子细胞的长短时记忆网络用于预测。为了得到预测结果的估计值及其可靠性指标,采用Bootstrap方法构建预测区间。为了验证所提方法的有效性,采用标准数据集、人工数据集和国内某钢铁厂能源系统中的工业实际数据进行测试。结果表明在相关预测问题上本文所提方法均具有较高的预测精度,所构建的预测区间具有良好的指标,可以满足工业现场的实际预测需求。