基于流形学习的工业不平衡数据下的故障诊断研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:stbruce
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的进步,工业过程向着智能化发展。由于设备一般工作在正常状态,只是在很短的时间内处于故障状态,导致采集的各类故障数据呈现出不平衡的特点,给故障诊断带来了困难。同时,采集到的数据还具有不平衡、非线性、强耦合和具有流形结构等特点。如何对不平衡故障样本进行数据生成并提取有效特征,成为提高诊断精度的重要因素。流形学习算法相比与传统故障诊断方法,能保留数据的局部结构信息,提取与故障相关的主要特征。局部敏感判别分析(LSDA)作为一种局部流形学习方法,既能保持局部几何结构,又能充分利用类标签进行判别分析。因此,本文利用两种基于改进SMOTE并集成LSDA的不平衡故障诊断方法,对化工过程进行建模,具体内容如下:(1)本文先提出了一种基于聚类合成少数过采样技术(ClusterSMOTE)集成LSDA的故障诊断方法——c SMOTE-LSDA。其中,c SMOTE通过K-Means算法对少数类进行聚类,先划分出若干个少数类簇,再分别应用SMOTE算法。该算法不仅可以滤除噪声和离群值,还使得合成的新样本都处在同一个少数类范围内,避免类间重叠样本的生成,并大大降低计算量。再利用流形学习的LSDA算法对平衡后的高维、非线性样本进行降维,提取有效的数据特征,并采用Ada Boost.M2多分类器进行故障分类。(2)为了进一步提高少数类故障样本的生成质量和故障诊断精度,本文又提出了一种基于改进的合成少数类过采样技术(ISMOTE)集成LSDA的故障诊断方法——ISMOTE-LSDA。ISMOTE使用了欧氏距离和余弦距离共同度量两点之间的邻近性,考虑了直线位置又考虑了空间几何位置,使样本的k个近邻点的选择更加合理,从而得到更有效的实例。该算法成功解决c SMOTE的合成方式单调、未考虑空间位置的问题,提高故障诊断的准确性。(3)最后,本文以田纳西伊斯曼过程数据集为研究对象,来分别验证这两种方法的性能。结果表明,本文所提出的c SMOTE-LSDA方法比传统的故障诊断方法具有更好的故障诊断精度,且经过改进的ISMOTELSDA进一步提升了少数类样本的生成质量与故障诊断的精度,更适用于不平衡故障诊断问题。
其他文献
高通量分子模拟方法已经被证明是一种从庞大的金属有机框架(MOFs)数据库中筛选具有潜在应用前景MOFs材料的有力的手段。但是利用传统的高通量分子模拟方法对几十万个MOFs材料进行逐个筛选的效率太低。因此,寻求加速高性能MOF材料筛选的方法势在必行。本文的第一个工作利用机器学习方法(Maching Learning,ML)来加速高CO2/CH4分离性能的MOFs材料筛选过程。本研究首先应用巨正则蒙特
学位
卵巢早衰(premature ovarian failure,POF)属于妇科内分泌疾病,临床治疗较为困难。POF的发病机制复杂,中医认为与肾虚、冲任虚衰等有关,治疗当以补肾填精、调理冲任为主,临床也需辩证施治。西医则认为与遗传、免疫、环境、医源性因素等有关,治疗方法以激素替代疗法、促排卵疗法、干细胞移植等为主,临床中POF的治疗以中西医结合为常见方案。现从中西医两个角度出发,对各自的发病机制给予
期刊
SLAM(Simultaneous Localization and Mapping,同时定位与建图)是智能移动机器人实现自主化的关键技术之一。随着服务机器人市场需求日益扩大,SLAM技术得到了更多研究者的关注。目前大多数SLAM算法都是基于场景刚性假设进行设计的,因此动态环境泛化能力差。此外,单一传感器无法满足复杂环境的需要,通常与其他传感器结合以提高系统的鲁棒性。本文针对以上问题,对视觉惯性S
学位
随着电子设备规模的增大与电路结构复杂性的增加,模拟电路的测试和故障诊断越来越困难。近年来,研究人员试图从数据和模型两个角度来研究测试方法以提高模拟电路故障诊断的准确率。通过对电路可测性的研究,学者们发现测试点的选择是一种有效提升数据分辨率的手段。目前对测点选择的研究大多是基于整数编码表进行的,但由于整数编码表是通过设定电压阈值来判断故障的可分性,这种方法对于一些表现相近的故障无法精确的度量;且目前
学位
平面对称群是欧几里得平面等距线的不连续子群,在平面内两个线性独立的等距平移下表现不变性。因其在晶体学、化学、物理、图案设计等方面的应用价值,平面对称群受到广泛的关注。人们可以凭借与生俱来的感知对称的能力,对17种平面对称群图案进行分类。然而,在过去的几十年里,平面对称群图案的自动分类仍然是一个艰巨的挑战。本文的目的是为了找到一种自动而有效的方法从图片中识别这17种平面对称群结构。本文所做工作如下:
学位
随着互联网和移动设备的发展,线上社交媒体用户数激增,使得在线社交网络(Online Social Network,OSN)已经具有相当复杂的自身特性和行为模式,吸引了很多研究学者对社交网络的特性、模式及规律等进行分析研究。但由于在线社交网络具有庞大的规模,同时涉及到隐私访问限制等问题,使得获取完整的大规模在线社交网络数据具有一定困难。因此,很多研究都是基于社交网络的样本网络进行实验。样本网络的质量
学位
目的 分析社区老年人肌肉减少症(肌少症)的患病率及影响因素。方法 检索PubMed、Embase、The Cochrane Library、Web Of Science、CINAHL、维普数据库、中国知网、万方数据库、中国生物医学文献服务系统等数据库从建库至2021年7月关于社区老年人肌少症患病率及影响因素的相关文献,采用RevMan 5.3软件对社区老年人肌少症患病率及影响因素进行meta分析。
期刊
旅行商问题是一种在组合优化领域广泛研究的NP-hard问题,目前研究学者已经开发了许多不同的群体智能和近似算法来解决该问题。但到目前为止,关于旅行商问题多解优化的相关研究较少,因此本课题主要针对蚁群优化算法进行相应的改进以更好地解决多解旅行商问题。在群体智能算法方面,本文主要总结群体智能算法的结构与特性。在多解旅行商问题方面,本文主要整合相关测试集及评价指标用于算法的有效性验证,并提出一种基于蚁群
学位
城市是典型的动态复杂系统,个体间以及个体与外部环境间存在的较强的非线性相互作用和由此产生的涌现行为是复杂城市系统的重要特征。城市的正常运作有赖于大量个体的高效交互,因而揭示居民间时空交互接触模式所蕴含的普适规律对于包括流行病传播、城市规划及交通工程等各类城市研究至关重要。然而过去由于数据采集的限制,学者们难以获取高时空精度的个体轨迹与交互数据。近年来随着信息通信技术的发展,手机已然成为某种意义上的
学位
一直以来,社团划分和聚类分析被认为是相似的,其目的都是将相似的对象分为一组,但近几十年来都被分开研究,缺少一个统一的框架去处理这两类问题,其中一个重要原因在于向量数据和拓扑数据之间的差异。异质性是网络拓扑中社团结构和向量数据中簇结构存在的共同条件,它表示数据的重要属性间存在差异,相比之下,均质性的晶格网络或随机均匀分布的数据点则不存在团簇结构。以异质性为基础,本文将向量数据中密度的概念扩展至拓扑数
学位