论文部分内容阅读
文章针对钢轨裂纹声发射信号特性人工提取效率低的问题,应用CNN与BiLSTM手段进行钢轨裂纹声发射信号提取的研究,通过预处理采集的实际钢轨裂纹声发射信号,对其特征信息进行提取及分类,分别构建基于一维CNN、二维CNN钢轨裂纹检测模型,证明前者效果优于后者。根据钢轨裂纹信号拥有时序的特性,构建不同递归网络钢轨裂纹检测模型,并对比RNN与LSTM模型检测钢轨裂纹的性能,优化BiLSTM钢轨裂纹检测模型的方法证明能够应用于钢轨裂纹的检测。
钢轨裂纹;声发射信号;BiLSTM;一维CNN
U216.4A371304
0 引言
近年来,高速铁路的发展已成为全球发展的一个重要趋势。我国在铁路里程数上取得了全球第一的成绩,创下全球最高列车时速的傲人纪录,令世界叹服。随着速度的一次次提升,人们更加注重列车运行的安全性。在高速列车运行过程中,容易形成轮轨间长期的反复接触,使得钢轨受重载挤压力大于普通钢轨,造成钢轨出现裂纹的几率变大。钢轨裂纹容易出现扩展,若不及时进行检测并采取防治措施,继续在承受强大外力的作用下使用,就会形成钢轨断裂,发生安全事故。因此,及时对钢轨裂纹进行检测成为了铁路安全运营中最重要的一步[1]。
国外针对钢轨裂纹的研究相比国内要早,美国某公司早在1928年就利用磁感应[2]对钢轨裂纹进行检测,成为了当今最早使用铁路检测技术的国家。随着钢轨裂纹检测技术的深入研究和深度学习,其运用在故障检测中的次数增多,研究学者们提出一种深度卷积网络[3](深度CNN),对钢轨裂纹进行检测,为此利用深度学习对钢轨裂纹声发射技术的研究便慢慢兴起。接着美国学者用二维信号表示钢轨裂纹声发射信号[4],并基于卷积神经网络实现了很好的分类。国内对钢轨裂纹检测技术于1951年开始探索,由国内铁路部门开展,铁路部门用超声波技术对钢轨裂纹进行检测,最常用的检测技术是超声检测与涡流检测。但这两种检测方式不能实现实时的轨道探测,所以我国大多通过结合手推式轨道检测与全自动检测技术作为主要的探测方式进行探测,这种情况反映出国内对声发射钢轨裂纹检测技术的深度学习和研究较少。为此,国内学者利用卷积神经网络识别钢轨裂纹所处阶段,并选取多次网络输出共同判断检测结果[5]。中国科技技术大学[6]建立了基于BP神经网络的模型,并采用深度神经网络,建立一套智能监测模型。
综上国内外研究发现,将声发射信号利用于钢轨裂纹信号的检测是可行的,但由于其特征信息提取的复杂性,研究如何在没有标签数据下进行网络训练成为一项重点任务。因此,本文对钢轨裂纹检测方法进行进一步研究:提取与分类预处理的钢轨裂纹数据信息,分别基于一维CNN和二维CNN建立检测模型,证明CNN适合处理钢轨裂纹信号;建立监督学习研究内容,利用不同递归神经网络对钢轨裂纹进行识别,获得最佳检测效果BiLSTM;对钢轨裂纹检测模型进行优化,得到能够实现钢轨裂纹检测的方法。
1 钢轨裂纹检测
本节详细介绍了钢轨裂纹声发射信号的采集及预处理过程,并引用此数据构造分帧样本集,将样本集通过时域、频域与时频域提取特征信息和分类,最后对样本进行端到端的训练,比较分别尝试用一维CNN、二维CNN构建钢轨裂纹检测模型的效果。
1.1 声发射信号采集及预处理
钢轨裂纹进行检测时需保持钢轨裂纹信号的质量,才能构造裂纹信号与噪声信号的分帧样本集,但实际高速铁路情况复杂,获得的数据有多种干扰信号。因此,想要提供更优质的钢轨裂纹声发射信号给后续实验,就需要搭建实验室系统才能满足要求,而不能直接使用采集到的钢轨裂纹信号。
(1)数据采集:实验所采用的数据源于某试验场与实验室,在试验场地钢轨上施加裂纹信号,当列车经过实验系统时采集数据,将得到的钢轨裂纹数据进行检测研究。本实验系统装置分为模拟裂纹信号的产生与钢轨裂纹信号采集两部分,由这两部分组成的实验系统装置可得到模拟裂纹信号时域图、模拟裂纹信号小波图,通过观察小波图又可获得裂纹持续时间及模拟裂纹信号频率范围,为下一步实际铁路工况下进行实验做准备工作。随后观察整趟列车声发射信号幅值-时间图,得到最大幅值为90 mv,信噪比为-28 db,该数据使模拟裂纹信号完全被覆盖,且噪声不断增加衰减为检测带来巨大困难,所以需要对数据进行去噪处理。
(2)数据去噪:模拟裂纹信号拥有其自身的频谱特点,根据频谱特点观察环境噪声与裂纹信号的小波图,得到应选用200~800 kHz内的数据进行研究。使数据能够固定频率、带的信号及去除范围外的信号。本节选用FIR滤波器作为带通滤波器进行计算,FIR滤波器函数如式(1)所示。通过观察滤波器函数计算后频率内带通滤波器去噪后的信号图可以发现,整段信号峰值由90 mv降至24 mv,信噪比由-28 db升高至16.5 db,證明了带通滤波器的效果。
H(z)=a(z)b(z)=∑N-1n=0h(n)z-n(1)
(3)样本采集设计:本文需选取钢轨裂纹信号与不同类型的噪声构建钢轨裂纹检测实验的数据集,才能提取钢轨裂纹的特征信息及提供后续训练、测试钢轨裂纹检验的算法。本节对裂纹信号与5类噪声进行数据分帧,单个样本长度选取量为1 024个,最后得到48 681个样本,并采用独热编码进行分类标记,如表1所示。
1.2 钢轨裂纹特征提取
基于时域、频域与时频域的特征分析可发现,需要设计一分类器将三者合在一起才能实现区分噪声与裂纹信号。因此,本文采用具有很好的非线性拟合能力、可以拟合不同的函数及适应于多分类任务的BP网络进行任务的多分类。各类噪声以裂纹信号在BP网络中的准确率如表2所示。
由表2可以发现,BP网络信号能很好地识别常规噪声,但面对裂纹信号时信号精度会下降,表明钢轨裂纹与噪声特征提取与各种噪声的干扰有关,侧面反映出现有技术在解决钢轨裂纹检测方面不能很好地体现出其优异之处,因此,需通过提升钢轨裂纹检测的精度来实现钢轨裂纹有效特征信息的提取。 1.3 CNN模型搭建及实验对比与分析
CNN与现有人工设计提取方法不同,因为CNN可以实现特征的自动化提取[7],及一维特性是钢轨裂纹信号特有的表现方式这一特点,所以采用一维CNN对其进行处理所得结果的解释性更强。本节将采用一维CNN来构建钢轨裂纹模型与二维CNN构建模型进行对比,分析两种方法的检测效果。卷积神经网络结构如图1所示。
一维CNN钢轨裂纹检测模型样本尺寸数据为1 024×1,数据集包括裂纹信号和5种噪声,共6类信号,所以输入层尺寸数据为1 024×1,输出层尺寸数据为6×1。一维CNN模型如图2所示。为了适应二维CNN构建,需将一维样本尺寸1 024×1的维度更换为二维矩阵32×32后再进行数据的输入,二维CNN数据集包括裂纹信号和5种噪声,共6类信号,输出层为6×1。二维CNN模型如图3所示。
为了更好地验证模型的有效性,本实验基于Tensorflow框架[8]运用Python语言和计算机应用完成网络模型的构建,从中选取样本的信号,并选取7/10作为样本进行训练,其余3/10检测网络性能,学习率设定0.001。整个CNN的检测效果可以通过误差的收敛曲线很好地反映,因此通过对比一维CNN与二维CNN建立模型的损失函数和准确率曲线,可以评估两类模型的钢轨裂纹检测效果。损伤函数如图4所示。准确率曲线如图5所示。
由图4和图5可以看出,一维CNN模型损失函数下降快,且最终收敛时损失函数值也明显小于二维CNN模型,最终准确率为84.51%,要高于BP分类器的准确率,可以看出一维CNN检测性能要优于二维CNN。
2 BiLSTM的钢轨裂纹检测
钢轨裂纹声发射信号是一种具有上下联系的时序信号,为此基于RNN与LSTM的递归网络来捕捉钢轨裂纹时序信号[9],将准确率进行对比分析,得到适合的测试方法。
2.1 构建网络模型
根据递归神经网络可以很好地解决钢轨裂纹时序信号检测的问题这一理论[10],构建RNN、LSTM、BiLSTM三种递归网络,并对比钢轨裂纹信号检测的效果。选取前文钢轨裂纹输入的6类信号,选择帧长128,帧移32,网络输入128×1来减少循环网络神经结构。构建RNN模型结构如图6所示;构建LSTM模型结构如图7所示;构建BiLSTM模型结构如图8所示。
2.2 实验数据对比
RNN、LSTM、BiLSTM三种网络程序的运行配置与钢轨裂纹特征提取配置一致,设置7/10进行训练,3/10检测网络性能,学习率为0.001。三类模型训练损失函数如图9所示;各模型准确率曲线如图10所示。由图9~10可以看出,RNN损失函数小于另外两者,但损失值最大。而BiLSTM与LSTM对比,前者损失函数值下降最快,且最终损失函数值要小于后者,所以BiLSTM检测性能要比LSTM性能好,准确率也高于LSTM。三类模型的准确率随着迭代次数的增加逐渐提高,在对比三类模型后发现仅有BiLSTM的准确率在不断提升,其最终准确率为87.57%,证明了BiLSTM检测效果要优于其余两者。
为了进一步探索得到最优的模型参数,并提高检测准确率,使其达到检测效果,继续对检测模型进行优化,发现网络层数与每层隐藏节点数为检测模型待优化的参数。现对三种模型中具有最佳检测效果的BiLSTM模型进行分析,先构造两层BiLSTM层,再分别选用64、128、256、512作为模型的隐藏节点,实验对比结果如表3所示。由表3可以看出,节点512与256对比,仅提升了0.1%,没有发生很大的变化,所以根据成本,隐藏节点选用256为最优。
其次选用隐藏节点数为256,分别对LSTM与BiLSTM进行分析。对前者网络层数设置为4层,后者设置为3层,构造网络并进行训练,比较两种模型不同层数对钢轨裂纹检测准确率的影响。如表4所示。
由表4可以看出,LSTM準确率随网络层次数目的增加,先上升后下降,在4层的时候准确率最大,为88.81%,超过4层又下降,所以LSTM选用隐藏节点256,网络层数4层时为最佳检测效果;BiLSTM准确率增加到一定程度后继续下降,在3层的时候准确率最大,为89.15%,仅比2层高了0.23%,而4层时的准确率均比2、3层时准确率小,且用时也会延长。为此考虑成本与检测精度,BiLSTM网络层选用隐藏节点256,网络层数2层时为最佳检测效果。
3 优化双向长短时记忆网络的钢轨裂纹检测模型
3.1 改进BiLSTM模型的搭建
相比较BP网络分类器,钢轨裂纹信号的一维特性能很好地被一维CNN模型适应,提取钢轨裂纹局部特性信号,但没考虑到钢轨裂纹信号的时序信息。而BiLSTM考虑了裂纹信号时序信息,可以捕捉长期依赖关系,拥有比一维CNN更高的准确度,但提取特性信息的能力较弱。为此通过将两者结合,提出一种改进的BiLSTM结构,更好地进行钢轨裂纹检测,并构建全连接层对钢轨裂纹检测进行预测。网络模型如图11所示。
3.2 实验结果与分析
采用预处理裂纹声发射信号作为输入数据,根据与前文相同的计算方法进行计算,通过数据图分析得到平均准确率为91.24%,随后将表现最好的不同模型准确率进行对比,如表5所示,可以看出,一维CNN与BiLSTM结合模型的准确率相比前四者都有提升,且达到了最高准确率,为91.24%。将此数据导入混淆矩阵进行评估,得到每类信号准确率均为90%以上,证明改进的BiLSTM模型可以对复杂情况下的钢轨裂纹信号进行检测。
4 结语
本文通过真实情况下采集得到钢轨裂纹声发射信号,经过预处理后进行分类与特征提取,针对CNN和BiLSTM的钢轨裂纹检测方法进行研究,并提出一种基于一维CNN和BiLSTM结合的有监控钢轨裂纹检测模型,优化BiLSTM钢轨裂纹检测模型,实现更好的钢轨裂纹信号检测。主要结论如下: (1)利用预处理采集的声发射信号构建分帧样本集,提取钢轨裂纹和5种噪声的特征,通过BP网络设计检测模型,得到73.62%的准确率。结果表明,钢轨裂纹与噪声特征提取与各种噪声的干扰有关,需通过提升钢轨裂纹检测的精度,才能实现钢轨裂纹有效特征信息的提取。
(2)分别构建基于一维CNN与二维CNN的钢轨裂纹检测模型,对比两种方法,采用一维CNN可以有效地检测钢轨裂纹信息,且准确率为84.51%。证明了一维CNN效果优于二维CNN。
(3)针对钢轨裂纹时序信息,分别构建基于RNN、LSTM、BiLSTM的钢轨裂纹检测模型,对其进行检测分析与模型的进一步优化。结果表明,有且仅有隐藏节点为256、网络层次为2层时,BiLSTM模型检测效果最佳,准确率为88.92%。
(4)基于一维CNN提取特征信号的特性及BiLSTM拥有时序信息与捕捉长期依赖关系的特性,得到一维CNN与BiLSTM相结合的高效率检测性能的模型,检测准确率达到91.24%,能实现复杂情况下钢轨裂纹的检测工作。
[1]顾桂梅,贾文晶.钢轨轨底裂纹红外热波无损检测数值模拟分析[J].红外技术,2018,40(3):294-299.
[2]高运来.铁路钢轨裂纹的在线高速漏磁巡检[D].南京:南京航空航天大学,2013.
[3]X.Ding,Q.He,Energy-fluctuated multiscale feature learning with deepconvnet for intelligent spindle bearing fault diagnosis[J].IEEE Transactions on Instrumentation and Measurement,2017,66(8):1 926-1 935.
[4]于金涛.直升机复合材料试件声发射信号处理算法研究[D].哈尔滨:哈尔滨工业大学,2012.
[5]韩瑞东.基于卷积网络与长短时记忆网络的钢轨裂纹检测方法研究[D].哈尔滨:哈尔滨工业大学,2019.
[6]林 杨,高思煜,刘同舜,等.基于深度学习的高速铣削刀具磨損状态预测方法[J].机械与电子,2017,35(7):12-17.
[7]颜 荔.基于卷积神经网络的遥感图像飞机目标识别研究[D].合肥:中国科学技术大学,2018.
[8]袁群勇.深度神经网络的训练优化方法研究[D].广州:华南理工大学,2020.
[9]周长义,孙 伟.基于声发射检测的钢轨断裂实时监测及定位方法研究[J].铁道科学与工程学报,2020,17(1):232-238.
[10]徐东坡.递归神经网络梯度学习算法的收敛性[D].大连:大连理工大学,2009.
[11]刘礼文,俞 弦.循环神经网络(RNN)及应用研究[J].科技视界,2019(32):54-55.
钢轨裂纹;声发射信号;BiLSTM;一维CNN
U216.4A371304
0 引言
近年来,高速铁路的发展已成为全球发展的一个重要趋势。我国在铁路里程数上取得了全球第一的成绩,创下全球最高列车时速的傲人纪录,令世界叹服。随着速度的一次次提升,人们更加注重列车运行的安全性。在高速列车运行过程中,容易形成轮轨间长期的反复接触,使得钢轨受重载挤压力大于普通钢轨,造成钢轨出现裂纹的几率变大。钢轨裂纹容易出现扩展,若不及时进行检测并采取防治措施,继续在承受强大外力的作用下使用,就会形成钢轨断裂,发生安全事故。因此,及时对钢轨裂纹进行检测成为了铁路安全运营中最重要的一步[1]。
国外针对钢轨裂纹的研究相比国内要早,美国某公司早在1928年就利用磁感应[2]对钢轨裂纹进行检测,成为了当今最早使用铁路检测技术的国家。随着钢轨裂纹检测技术的深入研究和深度学习,其运用在故障检测中的次数增多,研究学者们提出一种深度卷积网络[3](深度CNN),对钢轨裂纹进行检测,为此利用深度学习对钢轨裂纹声发射技术的研究便慢慢兴起。接着美国学者用二维信号表示钢轨裂纹声发射信号[4],并基于卷积神经网络实现了很好的分类。国内对钢轨裂纹检测技术于1951年开始探索,由国内铁路部门开展,铁路部门用超声波技术对钢轨裂纹进行检测,最常用的检测技术是超声检测与涡流检测。但这两种检测方式不能实现实时的轨道探测,所以我国大多通过结合手推式轨道检测与全自动检测技术作为主要的探测方式进行探测,这种情况反映出国内对声发射钢轨裂纹检测技术的深度学习和研究较少。为此,国内学者利用卷积神经网络识别钢轨裂纹所处阶段,并选取多次网络输出共同判断检测结果[5]。中国科技技术大学[6]建立了基于BP神经网络的模型,并采用深度神经网络,建立一套智能监测模型。
综上国内外研究发现,将声发射信号利用于钢轨裂纹信号的检测是可行的,但由于其特征信息提取的复杂性,研究如何在没有标签数据下进行网络训练成为一项重点任务。因此,本文对钢轨裂纹检测方法进行进一步研究:提取与分类预处理的钢轨裂纹数据信息,分别基于一维CNN和二维CNN建立检测模型,证明CNN适合处理钢轨裂纹信号;建立监督学习研究内容,利用不同递归神经网络对钢轨裂纹进行识别,获得最佳检测效果BiLSTM;对钢轨裂纹检测模型进行优化,得到能够实现钢轨裂纹检测的方法。
1 钢轨裂纹检测
本节详细介绍了钢轨裂纹声发射信号的采集及预处理过程,并引用此数据构造分帧样本集,将样本集通过时域、频域与时频域提取特征信息和分类,最后对样本进行端到端的训练,比较分别尝试用一维CNN、二维CNN构建钢轨裂纹检测模型的效果。
1.1 声发射信号采集及预处理
钢轨裂纹进行检测时需保持钢轨裂纹信号的质量,才能构造裂纹信号与噪声信号的分帧样本集,但实际高速铁路情况复杂,获得的数据有多种干扰信号。因此,想要提供更优质的钢轨裂纹声发射信号给后续实验,就需要搭建实验室系统才能满足要求,而不能直接使用采集到的钢轨裂纹信号。
(1)数据采集:实验所采用的数据源于某试验场与实验室,在试验场地钢轨上施加裂纹信号,当列车经过实验系统时采集数据,将得到的钢轨裂纹数据进行检测研究。本实验系统装置分为模拟裂纹信号的产生与钢轨裂纹信号采集两部分,由这两部分组成的实验系统装置可得到模拟裂纹信号时域图、模拟裂纹信号小波图,通过观察小波图又可获得裂纹持续时间及模拟裂纹信号频率范围,为下一步实际铁路工况下进行实验做准备工作。随后观察整趟列车声发射信号幅值-时间图,得到最大幅值为90 mv,信噪比为-28 db,该数据使模拟裂纹信号完全被覆盖,且噪声不断增加衰减为检测带来巨大困难,所以需要对数据进行去噪处理。
(2)数据去噪:模拟裂纹信号拥有其自身的频谱特点,根据频谱特点观察环境噪声与裂纹信号的小波图,得到应选用200~800 kHz内的数据进行研究。使数据能够固定频率、带的信号及去除范围外的信号。本节选用FIR滤波器作为带通滤波器进行计算,FIR滤波器函数如式(1)所示。通过观察滤波器函数计算后频率内带通滤波器去噪后的信号图可以发现,整段信号峰值由90 mv降至24 mv,信噪比由-28 db升高至16.5 db,證明了带通滤波器的效果。
H(z)=a(z)b(z)=∑N-1n=0h(n)z-n(1)
(3)样本采集设计:本文需选取钢轨裂纹信号与不同类型的噪声构建钢轨裂纹检测实验的数据集,才能提取钢轨裂纹的特征信息及提供后续训练、测试钢轨裂纹检验的算法。本节对裂纹信号与5类噪声进行数据分帧,单个样本长度选取量为1 024个,最后得到48 681个样本,并采用独热编码进行分类标记,如表1所示。
1.2 钢轨裂纹特征提取
基于时域、频域与时频域的特征分析可发现,需要设计一分类器将三者合在一起才能实现区分噪声与裂纹信号。因此,本文采用具有很好的非线性拟合能力、可以拟合不同的函数及适应于多分类任务的BP网络进行任务的多分类。各类噪声以裂纹信号在BP网络中的准确率如表2所示。
由表2可以发现,BP网络信号能很好地识别常规噪声,但面对裂纹信号时信号精度会下降,表明钢轨裂纹与噪声特征提取与各种噪声的干扰有关,侧面反映出现有技术在解决钢轨裂纹检测方面不能很好地体现出其优异之处,因此,需通过提升钢轨裂纹检测的精度来实现钢轨裂纹有效特征信息的提取。 1.3 CNN模型搭建及实验对比与分析
CNN与现有人工设计提取方法不同,因为CNN可以实现特征的自动化提取[7],及一维特性是钢轨裂纹信号特有的表现方式这一特点,所以采用一维CNN对其进行处理所得结果的解释性更强。本节将采用一维CNN来构建钢轨裂纹模型与二维CNN构建模型进行对比,分析两种方法的检测效果。卷积神经网络结构如图1所示。
一维CNN钢轨裂纹检测模型样本尺寸数据为1 024×1,数据集包括裂纹信号和5种噪声,共6类信号,所以输入层尺寸数据为1 024×1,输出层尺寸数据为6×1。一维CNN模型如图2所示。为了适应二维CNN构建,需将一维样本尺寸1 024×1的维度更换为二维矩阵32×32后再进行数据的输入,二维CNN数据集包括裂纹信号和5种噪声,共6类信号,输出层为6×1。二维CNN模型如图3所示。
为了更好地验证模型的有效性,本实验基于Tensorflow框架[8]运用Python语言和计算机应用完成网络模型的构建,从中选取样本的信号,并选取7/10作为样本进行训练,其余3/10检测网络性能,学习率设定0.001。整个CNN的检测效果可以通过误差的收敛曲线很好地反映,因此通过对比一维CNN与二维CNN建立模型的损失函数和准确率曲线,可以评估两类模型的钢轨裂纹检测效果。损伤函数如图4所示。准确率曲线如图5所示。
由图4和图5可以看出,一维CNN模型损失函数下降快,且最终收敛时损失函数值也明显小于二维CNN模型,最终准确率为84.51%,要高于BP分类器的准确率,可以看出一维CNN检测性能要优于二维CNN。
2 BiLSTM的钢轨裂纹检测
钢轨裂纹声发射信号是一种具有上下联系的时序信号,为此基于RNN与LSTM的递归网络来捕捉钢轨裂纹时序信号[9],将准确率进行对比分析,得到适合的测试方法。
2.1 构建网络模型
根据递归神经网络可以很好地解决钢轨裂纹时序信号检测的问题这一理论[10],构建RNN、LSTM、BiLSTM三种递归网络,并对比钢轨裂纹信号检测的效果。选取前文钢轨裂纹输入的6类信号,选择帧长128,帧移32,网络输入128×1来减少循环网络神经结构。构建RNN模型结构如图6所示;构建LSTM模型结构如图7所示;构建BiLSTM模型结构如图8所示。
2.2 实验数据对比
RNN、LSTM、BiLSTM三种网络程序的运行配置与钢轨裂纹特征提取配置一致,设置7/10进行训练,3/10检测网络性能,学习率为0.001。三类模型训练损失函数如图9所示;各模型准确率曲线如图10所示。由图9~10可以看出,RNN损失函数小于另外两者,但损失值最大。而BiLSTM与LSTM对比,前者损失函数值下降最快,且最终损失函数值要小于后者,所以BiLSTM检测性能要比LSTM性能好,准确率也高于LSTM。三类模型的准确率随着迭代次数的增加逐渐提高,在对比三类模型后发现仅有BiLSTM的准确率在不断提升,其最终准确率为87.57%,证明了BiLSTM检测效果要优于其余两者。
为了进一步探索得到最优的模型参数,并提高检测准确率,使其达到检测效果,继续对检测模型进行优化,发现网络层数与每层隐藏节点数为检测模型待优化的参数。现对三种模型中具有最佳检测效果的BiLSTM模型进行分析,先构造两层BiLSTM层,再分别选用64、128、256、512作为模型的隐藏节点,实验对比结果如表3所示。由表3可以看出,节点512与256对比,仅提升了0.1%,没有发生很大的变化,所以根据成本,隐藏节点选用256为最优。
其次选用隐藏节点数为256,分别对LSTM与BiLSTM进行分析。对前者网络层数设置为4层,后者设置为3层,构造网络并进行训练,比较两种模型不同层数对钢轨裂纹检测准确率的影响。如表4所示。
由表4可以看出,LSTM準确率随网络层次数目的增加,先上升后下降,在4层的时候准确率最大,为88.81%,超过4层又下降,所以LSTM选用隐藏节点256,网络层数4层时为最佳检测效果;BiLSTM准确率增加到一定程度后继续下降,在3层的时候准确率最大,为89.15%,仅比2层高了0.23%,而4层时的准确率均比2、3层时准确率小,且用时也会延长。为此考虑成本与检测精度,BiLSTM网络层选用隐藏节点256,网络层数2层时为最佳检测效果。
3 优化双向长短时记忆网络的钢轨裂纹检测模型
3.1 改进BiLSTM模型的搭建
相比较BP网络分类器,钢轨裂纹信号的一维特性能很好地被一维CNN模型适应,提取钢轨裂纹局部特性信号,但没考虑到钢轨裂纹信号的时序信息。而BiLSTM考虑了裂纹信号时序信息,可以捕捉长期依赖关系,拥有比一维CNN更高的准确度,但提取特性信息的能力较弱。为此通过将两者结合,提出一种改进的BiLSTM结构,更好地进行钢轨裂纹检测,并构建全连接层对钢轨裂纹检测进行预测。网络模型如图11所示。
3.2 实验结果与分析
采用预处理裂纹声发射信号作为输入数据,根据与前文相同的计算方法进行计算,通过数据图分析得到平均准确率为91.24%,随后将表现最好的不同模型准确率进行对比,如表5所示,可以看出,一维CNN与BiLSTM结合模型的准确率相比前四者都有提升,且达到了最高准确率,为91.24%。将此数据导入混淆矩阵进行评估,得到每类信号准确率均为90%以上,证明改进的BiLSTM模型可以对复杂情况下的钢轨裂纹信号进行检测。
4 结语
本文通过真实情况下采集得到钢轨裂纹声发射信号,经过预处理后进行分类与特征提取,针对CNN和BiLSTM的钢轨裂纹检测方法进行研究,并提出一种基于一维CNN和BiLSTM结合的有监控钢轨裂纹检测模型,优化BiLSTM钢轨裂纹检测模型,实现更好的钢轨裂纹信号检测。主要结论如下: (1)利用预处理采集的声发射信号构建分帧样本集,提取钢轨裂纹和5种噪声的特征,通过BP网络设计检测模型,得到73.62%的准确率。结果表明,钢轨裂纹与噪声特征提取与各种噪声的干扰有关,需通过提升钢轨裂纹检测的精度,才能实现钢轨裂纹有效特征信息的提取。
(2)分别构建基于一维CNN与二维CNN的钢轨裂纹检测模型,对比两种方法,采用一维CNN可以有效地检测钢轨裂纹信息,且准确率为84.51%。证明了一维CNN效果优于二维CNN。
(3)针对钢轨裂纹时序信息,分别构建基于RNN、LSTM、BiLSTM的钢轨裂纹检测模型,对其进行检测分析与模型的进一步优化。结果表明,有且仅有隐藏节点为256、网络层次为2层时,BiLSTM模型检测效果最佳,准确率为88.92%。
(4)基于一维CNN提取特征信号的特性及BiLSTM拥有时序信息与捕捉长期依赖关系的特性,得到一维CNN与BiLSTM相结合的高效率检测性能的模型,检测准确率达到91.24%,能实现复杂情况下钢轨裂纹的检测工作。
[1]顾桂梅,贾文晶.钢轨轨底裂纹红外热波无损检测数值模拟分析[J].红外技术,2018,40(3):294-299.
[2]高运来.铁路钢轨裂纹的在线高速漏磁巡检[D].南京:南京航空航天大学,2013.
[3]X.Ding,Q.He,Energy-fluctuated multiscale feature learning with deepconvnet for intelligent spindle bearing fault diagnosis[J].IEEE Transactions on Instrumentation and Measurement,2017,66(8):1 926-1 935.
[4]于金涛.直升机复合材料试件声发射信号处理算法研究[D].哈尔滨:哈尔滨工业大学,2012.
[5]韩瑞东.基于卷积网络与长短时记忆网络的钢轨裂纹检测方法研究[D].哈尔滨:哈尔滨工业大学,2019.
[6]林 杨,高思煜,刘同舜,等.基于深度学习的高速铣削刀具磨損状态预测方法[J].机械与电子,2017,35(7):12-17.
[7]颜 荔.基于卷积神经网络的遥感图像飞机目标识别研究[D].合肥:中国科学技术大学,2018.
[8]袁群勇.深度神经网络的训练优化方法研究[D].广州:华南理工大学,2020.
[9]周长义,孙 伟.基于声发射检测的钢轨断裂实时监测及定位方法研究[J].铁道科学与工程学报,2020,17(1):232-238.
[10]徐东坡.递归神经网络梯度学习算法的收敛性[D].大连:大连理工大学,2009.
[11]刘礼文,俞 弦.循环神经网络(RNN)及应用研究[J].科技视界,2019(32):54-55.