论文部分内容阅读
随着铁路信息化程度的不断提高,多业务融合需求程度不断增加,铁路工作者需要从纷繁复杂的业务数据中快速获取有价值的信息,传统的仅凭人工和传统的数据处理工具已经不能满足海量数据计算分析和列车运行实时监控的需求。铁路机车综合无线通信设备(简称为CIR,Cab Integrated Radio Communication Equipment)是确保列车调度指挥、保障行车安全的重要行车设备,承载着列车调度通信、防护报警、语音通信、列车尾部风压查询等重要功能。CIR设备在列车运行过程中记录了大量设备运行数据,直接反映出设备的运行状态。本论文力图通过对CIR数据的整理、分析,实现对车载设备故障分析与实时预测,为CIR设备维护、升级提供建设性意见。通过数据分析,可以对设备故障做到提前预防、事中诊断与定位、事后评估等功能,从而为设备维修工作的决策提供数据支持。本论文针对CIR数据进行深入分析、研究,根据其类似自然语言的特点,运用语义分析等自然语言学习领域广泛应用的数据模型进行深入挖掘分析,对无限隐马尔可夫模型和n-GRAM语言模型进行了改进,提出了 Beam采样无限隐马尔可夫模型和LSTM-n-GRAM模型,实现了CIR数据状态分类与与故障实时监测,与传统人工手动的数据分析手段相比,具有数据分析量大、准确性高、查询分析速度快、实时性强等特点。两种模型实现的方式和理论基础不同,但结论均反映了CIR数据具有马尔可夫性,丰富了列车故障分析与实时预测的理论,为设备维护与故障诊断提供了解决思路,并在铁路运输生产中得到了实际运用与验证,证明其具有理论价值和工程应用价值。具体包括以下几方面创新性工作:一是基于CIR数据的时序特性,结合马尔可夫假设,使用改进的无限隐马尔可夫模型——Beam采样无限隐马尔可夫模型对CIR数据进行分类,对正常状态和未知数量的异常状态进行划分,实现了对CIR状态的有效监测,并结合实际列车运行CIR数据进行了验证。二是考虑CIR故障监测的实时性要求,使用改进的n-GRAM模型——LSTM-n-GRAM模型进行了状态预测,并使用CIR数据得到了实际验证。实验表明:使用n-GRAM假设的短期数据与使用整个时间序列数据的模型性能没有明显差别,LSTM-n-GRAM模型在进行数据分析时无需使用全部数据进行计算,极大提升了计算效率,避免了梯度消失等问题。从而大大提高了 CIR状态监测的实时性。