论文部分内容阅读
随着工业互联网和信息技术的发展,工业生产数字化率和关键工艺流程数控化率都在不断上涨。对于企业而言,基于网络的生产设备、传感器、控制系统和管理系统等的广泛互联,使得大量工业现场数据的获取成为可能,并且伴随现场数据生成了一系列对应的解决方案和操作数据。同时,在工业系统的过程控制、现场操作和全流程的分析过程中产生了很多基于经验的“知识”。利用大数据技术对现场异常状态的解决方案进行案例匹配,基于案例匹配结果和经验“知识”构建为生产过程调控和决策支持的现场自主学习系统,是过程状态不完全可测的工业过程,例如高炉炼铁系统的迫切需求,对于保证生产过程稳定,不断优化操作控制具有重要意义。现场调控和决策支持自主学习系统作为实现海量数据感知、集成与分析,以及知识提取、分类与共享的载体,是实现制造业智能化发展的关键基础系统之一。本文对具有动态知识积累、静态知识更新和案例匹配功能的现场自主学习系统的关键技术进行了深入的分析。系统研究了案例匹配以及利用NLP技术构建知识库的问题。提出了基于主成分分析和模糊聚类算法的分级案例匹配方法以及基于多层门控卷积神经网络的半监督知识分类方法。论文的主要内容和创新性成果如下:(1)基于规则进行推理的专家系统在案例复用时需要建立大量的规则库,耗时耗力且匹配过程复杂,很难应对当今数据飞速增长的工业环境。为解决这一问题,本文提出了一种基于改进模糊聚类的分级案例匹配策略。为降低案例匹配复杂度,给出了基于PCA的案例数据特征提取方法,构建了案例特征空间;通过对聚类类别数、初始聚类中心、模糊加权指数等的优化,提出了模糊聚类优化方法,对案例特征空间进行聚类,以聚类算法得到的各子类中心点作为被匹配对象来与目标案例进行初级匹配;给出了案例综合特征权重计算方法,将匹配对象与初级匹配得到的中心点所对应的子类集成员进行次级匹配。仿真实验表明,所提算法有效提升了案例匹配速度和精度。(2)传统基于机器学习的知识分类方法要求大量带标签的训练样本,人工标记样本需要消耗大量时间和人力,标记效果也受限于人的知识储备,影响知识分类方法的泛化能力。为解决这一问题,提出了基于多层门控卷积神经网络的半监督知识分类方法。考虑到文本深度语义特征的挖掘,使用预训练词向量作为输入,设计了 Chunk-max pooling池化方式,引入线性门控单元的门控机制,构建了多层卷积神经网络,克服了网络深度增加导致模型浅层网络参数更新困难的问题;为了降低模型训练对于训练样本集的要求,使用Tri-training算法训练文本分类器,只需要少量的带标记样本初始化分类器。仿真实验表明,所提算法具有较好的知识分类效果。