论文部分内容阅读
摘要: 针对滚动轴承故障诊断时所提取的特征值中可能含有较小相关性和冗余性特征,采用基于Wrapper模式的距离评价技术(distance evaluation technique,简称DET)进行特征选择。在分类器的设计中,提出了基于稳健回归的多变量预测模型(Robust regressionVariable predictive model based class discriminate,简称RRVPMCD)分类方法,以减小 “异常值”对参数估计的影响,从而有望建立更加准确的预测模型。即根据Wrapper模式的特点,首先通过DET方法计算出各特征值对类的敏感度,并结合RRVPMCD分类器,选择敏感度最大的若干特征值组成特征向量矩阵;然后用RRVPMCD方法进行训练,建立预测模型;最后用所建立的预测模型进行模式识别。实验分析结果表明,基于Wrapper模式的特征选择方法和RRVPMCD分类方法相结合可以有效地对滚动轴承的工作状态和故障类型进行识别。关键词: 故障诊断; 滚动轴承; Wrapper模式; 特征选择; RRVPMCD;
中图分类号:TH165+.3; TH133.33文献标识码: A文章编号: 10044523(2014)04062908
引言
滚动轴承是旋转机械中不可或缺的一部分,其发生故障将直接影响到整个机械的运转,因此提高轴承可靠性、及时准确检测出轴承故障已变得越来越重要。
滚动轴承的故障诊断包括三个步骤,即信息获取、特征提取和模式识别。因此,能否准确有效地提取故障特征是故障诊断的关键之一。提取的特征值常常会出现两种不理想的状况,一是与分类目标无关的特征量;二是与其他特征量有较高相关性的冗余特征量。针对特征值中的这两种状况,可以采用特征选择方法剔除这两类特征。距离评价技术本身是一种过滤(Filter)模式的特征选择方法,其选择效率比较高,但该方法选择的特征子集和任何特定的分类器算法都无关,使得选择效果不理想[1]。因此,本文首先采用基于Wrapper模式的距离评价技术进行特征选择。封装(Wrapper)模式是结合分类器寻求最佳特征集合的一种方法[2],与分类器算法息息相关。基于Wrapper模式的DET特征选择方法就是首先计算各特征值的敏感因子,然后结合分类算法设定一个最佳阈值,从而选出对类较显著的特征,组成新的特征集,并通过分类器的分类性能来评价特征的可用性,最终实现滚动轴承的故障诊断。
分类器的设计是滚动轴承故障诊断的另一个关键。目前常用于故障诊断的分类器有神经网络和支持向量机等,神经网络分类器具有局部极小点、过学习、网络训练速度慢等缺陷,且过分依赖于先验知识和经验;支持向量机需要严格的核函数及其参数调整,核函数及其参数的选择对分类结果有很大的影响。尤其值得指出的是,这两种分类器都忽略了所提取特征值之间的内在关系。然而,在机械故障诊断中,所有或部分特征值之间大都具有一定的内在关系,而且这种内在关系在不同的系统或类别(相同的系统在不同的工作状态下)间具有明显的不同。
近来,Raghuraj与Lakshminarayanan提出了一种新的模式识别方法——基于多变量预测模型的模式识别(Variable predictive mode based class discriminate ,简称VPMCD)方法[3]。该方法的本质就是通过各个特征值之间的相互内在关系建立数学模型,对于不同的类别可以得到不同的数学模型,从而可以采用这些数学模型对被测试样本的特征值进行预测,把预测结果作为分类的依据,进一步进行模式识别。文献[3]同时还将该方法与神经网络、支持向量机等其它模式识别方法进行了对比,结果验证了VPMCD方法的有效性和优越性。但是,该方法是采用最小二乘回归进行参数估计,最小二乘回归是建立在自变量之间不存在高度线性相关的假定基础上,而实际情况中各种自变量之间总是存在着一定的线性相关性。当这种相关程度比较高时,采用最小二乘会导致回归分析的正则方程组出现病态,从而使最小二乘法的参数估计不稳定,模型拟合精度难以保证;另外最小二乘法以拟合曲线的残差平方和为目标函数,由于平方函数的增长较快,个别偏差较大的点对目标函数的贡献很大,往往错误地将拟合曲线拉向“异常值”的方向,最终导致建立的预测模型达不到分类要求[4,5]。
针对特征选择的要求和最小二乘回归的缺陷,本文提出了基于Wrapper模式的特征选择方法和基于稳健回归的多变量预测模型模式识别方法。即采用基于Wrapper模式的特征提取方法去除较小相关性和冗余特征;利用稳健回归代替最小二乘回归,其中稳健回归用M估计进行参数估计。M估计法通过改变目标函数来削弱“异常值”的影响,从而可以得到更加准确的模型参数,最终建立起更加真实的预测模型。
综上所述,本文提出的方法首先通过基于Wrapper模式的距离评价技术进行特征选择,选出合适的特征值组成新的特征集;接着用RRVPMCD方法进行训练,减弱“异常值”对参数估计的影响;然后通过特征值之间的相互内在关系建立预测模型;最后,用所建立的预测模型对故障状态进行分类和识别。实验分析结果表明,基于Wrapper模式的特征选择和RRVPMCD方法可以有效地识别滚动轴承的工作状态和故障类型。
1基于Wrapper模式特征选择和RRVPMCD的模式识别方法1.1基于Wrapper模式的距离评价技术特征选择方法距离评价技术特征选择方法是基于特征间的距离大小来求特征值对类的敏感度。其判定原则是:同一类内的样本特征距离最小;不同类的样本特征距离最大。能够符合这一原则的特征被认为是敏感特征。如果某一特征的类内距离越小,而不同类的类间距离越大,则说明这一特征越敏感;反之,越不敏感。因此距离评估技术是根据特征值对类的敏感度来选择最为敏感的若干个特征。但敏感度的阈值很难把握,如果阈值选择过大,则会丢失比较敏感的特征值;如果选择过小,则可能使得冗余特征过多,影响分类效率。 第4期杨宇,等: 基于特征选择和RRVPMCD的滚动轴承故障诊断方法振 动 工 程 学 报第27卷目前关于阈值的选择没有公认的标准,鉴于阈值选择对于分类精度和分类效率的重要性,本文采取RRVPMCD与DET相结合的Wrapper封装模式确定阈值,并最终确定特征参数。即首先通过DET求出每个特征值的敏感因子,接着让阈值逐一等于每个敏感因子的值,选出相应的敏感特征值,组成特征向量,然后通过RRVPMCD方法对已知样本进行训练和测试,求出识别率。当识别率最高时,则说明所选特征值能最大限度地反应状态信息。此外,如果识别率达到最高时,所选特征值越少,则诊断时间越少,效率越高。特征选择目的就是在提高诊断精度的同时降低特征空间的维数,从而减少分类器的训练时间。因此,选择此时的阈值及相应的特征值为最佳。
1.2基于Wrapper模式特征选择的RRVPMCD模型分类识别过程在机械故障中,采用p个不同的特征值X=[X1,X2,…,Xp]来描述一个故障类别,在不同的故障类别中,4结论
本文将特征选择和RRVPMCD相结合应用于滚动轴承的故障诊断中,研究得出以下结论:
(1)对所提取的特征值通过基于Wrapper模式的DET方法进行特征选择,剔除了不相关性、较小相关性和冗余特征值,从而选出对类最敏感的特征值。
(2)RRVPMCD方法采用稳健回归代替最小二乘回归进行参数估计,减小了估计值受“异常值”的影响,可以得到比较真实的模型。
(3)RRVPMCD中预测模型的建立本质上是参数估计的过程,从而避免了神经网络结构和类型的选择以及支持向量机中核函数和参数的选择。而这些参数、核函数、结构和类型的选择往往都过分依靠经验或先验知识。因此,RRVPMCD模式识别方法受主观因素的影响较少,所得分类结果更客观。
对滚动轴承正常状态、内圈故障、外圈故障和滚动体故障振动信号的分析结果表明,特征选择和RRVPMCD相结合的滚动轴承故障诊断方法可以准确、有效地对滚动轴承的工作状态和故障类型进行分类,从而为滚动轴承的故障诊断提供了一种新的方法。参考文献:
[1]Xu Zengbing, Xuan Jianping, Shi Tielin, et al. Application of a modified fuzzy ARTMAP with featureweight learning for the fault diagnosis of bearing [J]. Expert Systems with Applications,2009, 36: 9 961—9 968.
[2]Sun Zehang, Bebis George, Miller Ronald. Object detection using feature subset selection [J]. Pattern Recognition, 2004, 37:2 165—2 176.
[3]Raghuraj Rao, Lakshminarayanan Samavedham. Variable predictive modelsA new multivariate classification approach for pattern recognition applications [J]. Pattern Recognition, 2009, 42(1):7—16.
[4]Breiman L. Heuristics of instability and stabilization in model selection [J].The Annals of Statistics, 1996, 24(4): 2 350—2 383.
[5]Ma Jinji,Li Suwen. Retrieving method of differential optical absorption spectroscopy based on Mestimator robust regression[J]. Acta Photonica Sinica, 2009, 38(8):2 035—2 039.
[6]Norden E Huang, Zheng Shen, Steven R Long. A new view of nonlinear water waves: the Hilbert spectrum [J]. Annu.Rev. Fluid Mech.,1999, 31: 417—457.
[7]Jonathan S Smith. The local mean decomposition and its application to EEG perception data [J]. Journal of the Royal Society Interface, 2005, 2(5): 443—454.
[8]Cheng J S,Yu D J,Yang Y. Energy operator demodulating approach based on EMD and its application in mechanical fault diagnosis[J].Chinese Journal of Mechanical Engineering, 2004,40( 8):115—118.
[9]Lei Yaguo, He Zhengjia,Zi Yanyang.Application of the EEMD method to rotor fault diagnosis of rotating machinery [J]. Mechanical Systems and Signal Processing,2009, 23:1 327—1 338. [10]Mark G Frei, Ivan Osorio. Intrinsic timescale decomposition: timefrequencyenergy analysis and realtime filtering of nonstationary signals [J].Proceedings of the Royal Society A, 2007, 463: 321—342
[11]程军圣,郑近德,杨宇.一种新的非平稳信号分析方法——局部特征尺度分解[J].振动工程学报,2012, 25(2):215-220.
Cheng Junsheng,Zheng Jinde,Yang Yu.A nonstationary signal analysis approach—the local characteristicscale decomposition method[J].Journal of Vibration Engineering, 2012, 25(2): 215—22.
[12][KG2〗Case Western Reserve University Bearing Data Center. Bearing Data Center Fault Test Data.[EB/OL].[20091001].http://www.eecs.case.edu/laboratory/bearing.
The rolling bearing fault diagnosis method based
on the feature selection and RRVPMCD
YANG Yu, PAN Haiyang, CHENG Junsheng
(State Key Laboratory of Advanced Design and Manufacture for Vehicle Body,
Hunan University, Changsha 410082, China)
Abstract: Aiming at the disadvantage that the extraction features may contain smaller correlation and redundancy characteristics in the rolling bearing fault diagnosis, distance evaluation technique (DET) based on Wrapper was used for feature selection. In the design of the classifier, regressionVariable predictive mode based class discriminate (RRVPMCD) was put forward to reduce the effect of abnormal value in the estimation of parameters, therefore more accurate prediction models can be built up. According to the characteristics of the Wrapper mode, firstly, the sensitivities of each feature were calculated for class by using DET,and several features with the biggest sensitivity were chosen to establish feature vector matrix combined with RRVPMCD,then, a predictive model was built with the method of RRVPMCD, finally, the established predictive model was used for pattern recognition. Experimental results show that the model based on the Wrapper feature selection and RRVPMCD method can effectively identify work status and fault type of rolling bearing.Key words: fault diagnosis; rolling bearing; Wrapper mode; feature selection; robust regressionvariable predictive model based class discriminate作者简介:杨宇(1971—),女,教授,博士生导师。电话:(0731)88664008;Email:[email protected]
通讯作者:何勇(1979—),男,讲师。电话:(0571)87951817608;Email: [email protected]
参考文献
Fig.1(d) Vibration signal waveform of rolling bearing with the ball fault in time domain
Yang Yu, Pan Haiyang, Cheng Junsheng(State key Laboratory of Advanced Design and Manufacture for Vehicle Body, Hunan University, Changsha, 410082)Abstract:
中图分类号:TH165+.3; TH133.33文献标识码: A文章编号: 10044523(2014)04062908
引言
滚动轴承是旋转机械中不可或缺的一部分,其发生故障将直接影响到整个机械的运转,因此提高轴承可靠性、及时准确检测出轴承故障已变得越来越重要。
滚动轴承的故障诊断包括三个步骤,即信息获取、特征提取和模式识别。因此,能否准确有效地提取故障特征是故障诊断的关键之一。提取的特征值常常会出现两种不理想的状况,一是与分类目标无关的特征量;二是与其他特征量有较高相关性的冗余特征量。针对特征值中的这两种状况,可以采用特征选择方法剔除这两类特征。距离评价技术本身是一种过滤(Filter)模式的特征选择方法,其选择效率比较高,但该方法选择的特征子集和任何特定的分类器算法都无关,使得选择效果不理想[1]。因此,本文首先采用基于Wrapper模式的距离评价技术进行特征选择。封装(Wrapper)模式是结合分类器寻求最佳特征集合的一种方法[2],与分类器算法息息相关。基于Wrapper模式的DET特征选择方法就是首先计算各特征值的敏感因子,然后结合分类算法设定一个最佳阈值,从而选出对类较显著的特征,组成新的特征集,并通过分类器的分类性能来评价特征的可用性,最终实现滚动轴承的故障诊断。
分类器的设计是滚动轴承故障诊断的另一个关键。目前常用于故障诊断的分类器有神经网络和支持向量机等,神经网络分类器具有局部极小点、过学习、网络训练速度慢等缺陷,且过分依赖于先验知识和经验;支持向量机需要严格的核函数及其参数调整,核函数及其参数的选择对分类结果有很大的影响。尤其值得指出的是,这两种分类器都忽略了所提取特征值之间的内在关系。然而,在机械故障诊断中,所有或部分特征值之间大都具有一定的内在关系,而且这种内在关系在不同的系统或类别(相同的系统在不同的工作状态下)间具有明显的不同。
近来,Raghuraj与Lakshminarayanan提出了一种新的模式识别方法——基于多变量预测模型的模式识别(Variable predictive mode based class discriminate ,简称VPMCD)方法[3]。该方法的本质就是通过各个特征值之间的相互内在关系建立数学模型,对于不同的类别可以得到不同的数学模型,从而可以采用这些数学模型对被测试样本的特征值进行预测,把预测结果作为分类的依据,进一步进行模式识别。文献[3]同时还将该方法与神经网络、支持向量机等其它模式识别方法进行了对比,结果验证了VPMCD方法的有效性和优越性。但是,该方法是采用最小二乘回归进行参数估计,最小二乘回归是建立在自变量之间不存在高度线性相关的假定基础上,而实际情况中各种自变量之间总是存在着一定的线性相关性。当这种相关程度比较高时,采用最小二乘会导致回归分析的正则方程组出现病态,从而使最小二乘法的参数估计不稳定,模型拟合精度难以保证;另外最小二乘法以拟合曲线的残差平方和为目标函数,由于平方函数的增长较快,个别偏差较大的点对目标函数的贡献很大,往往错误地将拟合曲线拉向“异常值”的方向,最终导致建立的预测模型达不到分类要求[4,5]。
针对特征选择的要求和最小二乘回归的缺陷,本文提出了基于Wrapper模式的特征选择方法和基于稳健回归的多变量预测模型模式识别方法。即采用基于Wrapper模式的特征提取方法去除较小相关性和冗余特征;利用稳健回归代替最小二乘回归,其中稳健回归用M估计进行参数估计。M估计法通过改变目标函数来削弱“异常值”的影响,从而可以得到更加准确的模型参数,最终建立起更加真实的预测模型。
综上所述,本文提出的方法首先通过基于Wrapper模式的距离评价技术进行特征选择,选出合适的特征值组成新的特征集;接着用RRVPMCD方法进行训练,减弱“异常值”对参数估计的影响;然后通过特征值之间的相互内在关系建立预测模型;最后,用所建立的预测模型对故障状态进行分类和识别。实验分析结果表明,基于Wrapper模式的特征选择和RRVPMCD方法可以有效地识别滚动轴承的工作状态和故障类型。
1基于Wrapper模式特征选择和RRVPMCD的模式识别方法1.1基于Wrapper模式的距离评价技术特征选择方法距离评价技术特征选择方法是基于特征间的距离大小来求特征值对类的敏感度。其判定原则是:同一类内的样本特征距离最小;不同类的样本特征距离最大。能够符合这一原则的特征被认为是敏感特征。如果某一特征的类内距离越小,而不同类的类间距离越大,则说明这一特征越敏感;反之,越不敏感。因此距离评估技术是根据特征值对类的敏感度来选择最为敏感的若干个特征。但敏感度的阈值很难把握,如果阈值选择过大,则会丢失比较敏感的特征值;如果选择过小,则可能使得冗余特征过多,影响分类效率。 第4期杨宇,等: 基于特征选择和RRVPMCD的滚动轴承故障诊断方法振 动 工 程 学 报第27卷目前关于阈值的选择没有公认的标准,鉴于阈值选择对于分类精度和分类效率的重要性,本文采取RRVPMCD与DET相结合的Wrapper封装模式确定阈值,并最终确定特征参数。即首先通过DET求出每个特征值的敏感因子,接着让阈值逐一等于每个敏感因子的值,选出相应的敏感特征值,组成特征向量,然后通过RRVPMCD方法对已知样本进行训练和测试,求出识别率。当识别率最高时,则说明所选特征值能最大限度地反应状态信息。此外,如果识别率达到最高时,所选特征值越少,则诊断时间越少,效率越高。特征选择目的就是在提高诊断精度的同时降低特征空间的维数,从而减少分类器的训练时间。因此,选择此时的阈值及相应的特征值为最佳。
1.2基于Wrapper模式特征选择的RRVPMCD模型分类识别过程在机械故障中,采用p个不同的特征值X=[X1,X2,…,Xp]来描述一个故障类别,在不同的故障类别中,4结论
本文将特征选择和RRVPMCD相结合应用于滚动轴承的故障诊断中,研究得出以下结论:
(1)对所提取的特征值通过基于Wrapper模式的DET方法进行特征选择,剔除了不相关性、较小相关性和冗余特征值,从而选出对类最敏感的特征值。
(2)RRVPMCD方法采用稳健回归代替最小二乘回归进行参数估计,减小了估计值受“异常值”的影响,可以得到比较真实的模型。
(3)RRVPMCD中预测模型的建立本质上是参数估计的过程,从而避免了神经网络结构和类型的选择以及支持向量机中核函数和参数的选择。而这些参数、核函数、结构和类型的选择往往都过分依靠经验或先验知识。因此,RRVPMCD模式识别方法受主观因素的影响较少,所得分类结果更客观。
对滚动轴承正常状态、内圈故障、外圈故障和滚动体故障振动信号的分析结果表明,特征选择和RRVPMCD相结合的滚动轴承故障诊断方法可以准确、有效地对滚动轴承的工作状态和故障类型进行分类,从而为滚动轴承的故障诊断提供了一种新的方法。参考文献:
[1]Xu Zengbing, Xuan Jianping, Shi Tielin, et al. Application of a modified fuzzy ARTMAP with featureweight learning for the fault diagnosis of bearing [J]. Expert Systems with Applications,2009, 36: 9 961—9 968.
[2]Sun Zehang, Bebis George, Miller Ronald. Object detection using feature subset selection [J]. Pattern Recognition, 2004, 37:2 165—2 176.
[3]Raghuraj Rao, Lakshminarayanan Samavedham. Variable predictive modelsA new multivariate classification approach for pattern recognition applications [J]. Pattern Recognition, 2009, 42(1):7—16.
[4]Breiman L. Heuristics of instability and stabilization in model selection [J].The Annals of Statistics, 1996, 24(4): 2 350—2 383.
[5]Ma Jinji,Li Suwen. Retrieving method of differential optical absorption spectroscopy based on Mestimator robust regression[J]. Acta Photonica Sinica, 2009, 38(8):2 035—2 039.
[6]Norden E Huang, Zheng Shen, Steven R Long. A new view of nonlinear water waves: the Hilbert spectrum [J]. Annu.Rev. Fluid Mech.,1999, 31: 417—457.
[7]Jonathan S Smith. The local mean decomposition and its application to EEG perception data [J]. Journal of the Royal Society Interface, 2005, 2(5): 443—454.
[8]Cheng J S,Yu D J,Yang Y. Energy operator demodulating approach based on EMD and its application in mechanical fault diagnosis[J].Chinese Journal of Mechanical Engineering, 2004,40( 8):115—118.
[9]Lei Yaguo, He Zhengjia,Zi Yanyang.Application of the EEMD method to rotor fault diagnosis of rotating machinery [J]. Mechanical Systems and Signal Processing,2009, 23:1 327—1 338. [10]Mark G Frei, Ivan Osorio. Intrinsic timescale decomposition: timefrequencyenergy analysis and realtime filtering of nonstationary signals [J].Proceedings of the Royal Society A, 2007, 463: 321—342
[11]程军圣,郑近德,杨宇.一种新的非平稳信号分析方法——局部特征尺度分解[J].振动工程学报,2012, 25(2):215-220.
Cheng Junsheng,Zheng Jinde,Yang Yu.A nonstationary signal analysis approach—the local characteristicscale decomposition method[J].Journal of Vibration Engineering, 2012, 25(2): 215—22.
[12][KG2〗Case Western Reserve University Bearing Data Center. Bearing Data Center Fault Test Data.[EB/OL].[20091001].http://www.eecs.case.edu/laboratory/bearing.
The rolling bearing fault diagnosis method based
on the feature selection and RRVPMCD
YANG Yu, PAN Haiyang, CHENG Junsheng
(State Key Laboratory of Advanced Design and Manufacture for Vehicle Body,
Hunan University, Changsha 410082, China)
Abstract: Aiming at the disadvantage that the extraction features may contain smaller correlation and redundancy characteristics in the rolling bearing fault diagnosis, distance evaluation technique (DET) based on Wrapper was used for feature selection. In the design of the classifier, regressionVariable predictive mode based class discriminate (RRVPMCD) was put forward to reduce the effect of abnormal value in the estimation of parameters, therefore more accurate prediction models can be built up. According to the characteristics of the Wrapper mode, firstly, the sensitivities of each feature were calculated for class by using DET,and several features with the biggest sensitivity were chosen to establish feature vector matrix combined with RRVPMCD,then, a predictive model was built with the method of RRVPMCD, finally, the established predictive model was used for pattern recognition. Experimental results show that the model based on the Wrapper feature selection and RRVPMCD method can effectively identify work status and fault type of rolling bearing.Key words: fault diagnosis; rolling bearing; Wrapper mode; feature selection; robust regressionvariable predictive model based class discriminate作者简介:杨宇(1971—),女,教授,博士生导师。电话:(0731)88664008;Email:[email protected]
通讯作者:何勇(1979—),男,讲师。电话:(0571)87951817608;Email: [email protected]
参考文献
Fig.1(d) Vibration signal waveform of rolling bearing with the ball fault in time domain
Yang Yu, Pan Haiyang, Cheng Junsheng(State key Laboratory of Advanced Design and Manufacture for Vehicle Body, Hunan University, Changsha, 410082)Abstract: