基于主动学习和半监督学习的工业故障分类研究及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:axuxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过程监测技术作为过程系统工程中的重要组成部分,在保障复杂工业过程的稳定性和可靠性,提高企业产品质量等关键问题上具有重要的理论意义和实践意义。得益于集散控制系统(DCS)的不断发展和广泛应用,海量的工业数据得以保存,因此,基于数据驱动的工业故障诊断技术在学术界和工业界都得到了普遍关注。然而,将传统的模式识别方法应用到工业故障诊断上时忽略了流程工业过程中采集到的数据特点,包括有标签故障样本少、正常数据与故障数据以及不同类型的故障数据之间往往存在样本量不平衡的问题,因此不能在数据集上训练出高精度的分类模型来对故障进行有效识别。本文在已有的经典分类算法上,提出了基于不平衡小样本的故障分类技术,将主动学习和半监督学习的思想与传统的基于模式识别的故障分类方法结合起来,并加入了对不平衡数据的代价敏感学习和重采样处理。主要研究工作和成果包括以下几个方面:1)针对流程工业过程中有标签故障样本少、样本标注代价昂贵、样本集存在类不平衡以及样本孤点问题,首先提出了一种改进的主动学习结合加权支持向量机的工业故障分类算法。通过综合考虑样本的信息度和代表性以及样本中可能存在的孤立点,将改进的主动学习算法用于挖掘那些对当前分类模型最有价值的样本并提交给专家进行标注。在进行主动学习算法的研究时,提出了一种改进的加权支持向量机作为基分类模型。对于训练数据中的不同样本,根据其重要性采用不同的权重系数,同时充分考虑了样本点在特征空间分布情况对于主动学习和分类精度的影响,提出了一种新的惩罚系数选取方法,对不同类别的样本赋予不同的惩罚因子,从而有效避免了主动学习过程中采集到重复、无意义样本的问题,并提高了分类准确率。实验结果验证了所提出的的算法能够在获得较高分类精度的条件下有效减少标注负担。2)在主动学习的基础上,针对标注代价昂贵的问题,提出了将半监督学习的思想用于故障分类中,从而通过机器的自动迭代训练来提高故障诊断的精度,减少人工标注耗费的时间和精力。针对半监督训练中容易出现的伪标记有误问题,提出了将一种改进的基于多分类器贝叶斯决策融合的分类算法用于无标签样本的标签标注上,并分析了噪声数据的PAC可学习性以及训练集更新的充分条件,同时加入了基于最近邻规则的噪音数据剪辑方法和针对不平衡样本的SMOTE重采样技术,从而使得新样本的纯净度得到了有效的保证。实验证明,提出的半监督学习算法具有较高的分类精度和稳定性。3)针对主动学习和半监督学习两种算法本身的特性及其存在的互补性,研究了如何将这两种算法进行有效的结合来更大程度地提高分类性能。传统的主动学习方法,在选择了最具有信息量的未标记样本进行标记并用于模型更新后,不再继续利用剩余的大量未标记样本。而在有标签的训练样本非常稀少的情况下,分类结果不确定性最大的无标签样本很难通过半监督学习获得正确的标签,使得迭代过程中容易出现较为严重的错误自累积。因此,提出了一种集成主动学习和半监督学习的故障分类方法,将少量的主动学习和半监督学习结合,最大程度地改善诊断模型的性能。实验结果证明了所提出算法的有效性和优越性,具有较高的应用价值。
其他文献
欧洲ECE R129是用于儿童约束系统的测试法规,R129相比老版本的R44增加了儿童约束系统侧面碰撞试验的要求。本文以加速度台车作为基础,利用铝蜂窝在碰撞过程中溃缩吸能的特点,
目的:测定大骨节病患者和正常对照血清中硒和肿瘤坏死因子-α(TNF-α)、血管内皮生长因子(VEGF)和白介素-1(IL-1β)的水平。从细胞因子角度为研究其发病机制提供实验依据。方
提出将APD与前置放大器电路配合使用的最佳方法。利用光电转换信噪比数学模型,确定选择与APD匹配的电路器件,给出了前置放大器采用低噪声的分体器件与集成运算放大器相组合的
<正>一、运用多媒体触摸屏辅助幼儿数学活动,提高活动的实效性我们知道,数学知识比较抽象,尤其是对刚刚学会说话的幼儿来说,要想理解其中的数学本质真是一件难事。这就要求我
目的:建立测定药用胶囊中铬含量的方法。方法:选择干法灰化法处理胶囊,加入显色剂二苯碳酰二肼发生显色反应,利用紫外-可见分光光度法在540nm波长处进行测定,并与标准方法原
采用问卷调查和实验研究的方法,构建了以情感为中介的第三方正面评论与网络消费者冲动购买意愿的关系模型,并检验了产品类别和评论员级别对该模型的调节效应。研究结果表明:
目的:建立以气相色谱法测定瑞舒伐他汀中间体[4-(4-氟苯基)-6-异丙基-2-(N-甲基-N-甲磺酰基氨基)嘧啶-5-基]甲醇中乙醇、丙酮、二氯甲烷、正己烷、乙酸乙酯、甲苯和N,N-二甲
目的:观察大青膏外敷辅助治疗急性阑尾炎的临床效果并初步探讨其作用机理。方法:对山东中医药大学附属医院自2015年1月至2016年12月期间住院给予非手术治疗的急性阑尾炎患者
崛起于中原的汉族,迁入岭南经历了一个漫长的历史过程。秦代是汉族迁入岭南的开始。两汉之时,大一统中的华夏民族完成了向汉民族的转化。汉族不仅开始了向岭南新一轮的迁入,