论文部分内容阅读
随着信息技术的飞速发展,设备日趋集成化与复杂化。对于如何能及时发现和预测故障,保证设备在工作期间高效、可靠的运行,以及如何从历史故障数据中形成对故障处理有效的信息,都具有重要的研究意义。传统的故障诊断方法存在诊断模型难以建立、依赖于主观经验、难以获得规则等缺陷,针对故障的多样性、复杂性、隐蔽性和相互之间的联系性常常无能为力。特别是在面临大规模数据集时,并不能高效的进行分析处理。本文针对传统故障诊断的缺陷,深入研究了数据挖掘技术中并行关联规则算法,并应用于故障诊断之中,以完成对复杂设备的高效、准确、相关联的故障诊断。本文首先通过对国内外故障诊断系统的研究、应用现状和发展趋势的论述,探讨了传统故障诊断系统在分析处理方面的不足之处,从而提出了将数据挖掘中的关联规则技术引入故障诊断系统。对云计算的基本概念和核心技术做了阐述,讨论了Hadoop框架中分布式文件系统、MapReduce编程模型等关键技术。接着介绍了数据挖掘的概念、对象、方法以及数据挖掘在故障诊断中的应用。然后重点研究了数据挖掘技术中关联规则挖掘的理论与算法,并提出基于MapReduce的并行Apriori算法,针对故障数据的稀疏性特征,采用多最小支持度改进方法。最后,在前面研究讨论的基础上,将并行关联规则算法集成于故障诊断系统,建立面向故障诊断的关联分析子系统,并描述了该子系统结构和功能的设计与实现。本文对于将分布式并行关联规则应用于故障诊断系统具有一定的参考价值。