论文部分内容阅读
随着大数据时代的来临,信息共享、数据挖掘技术成为获取知识、创造财富、提高效率的重要工具。而在我国快速发展的高铁技术中,GSM-R网络已成为承载列控信息传输不可缺少的重要部分。本文重点研究了数据挖掘技术在高铁GSM-R网络检测/监测数据分析中的应用,针对GSM-R网络服务质量(QoS)测试综合评价问题、测试数据如何反映真实列控数据传输问题和C3(CTCS-3)降级故障类别自动诊断问题,通过深入分析GSM-R网络检测数据、接口监测数据,提出了有效解决方案,主要取得了以下研究成果:1、针对目前GSM-R网络QoS测试中,各测试指标独立评价,缺乏综合评估手段的现状,提出综合评价GSM-R网络QoS测试结果的方法。应用K-means聚类算法、KNN分类算法建立基于历史测试数据的评价模型;同时,建立完全基于指标规范要求的评价模型;综合两个模型的评价结果,给出对GSM-R网络QoS测试的最终评价。所提出的综合评价方法可以合理地反映测试结果实际水平。2、对GSM-R网络QoS测试原始数据进行分析:(1)研究CSD干扰测试数据传输与真实列控数据传输的关系,利用其相似性,建立干扰时间(干扰帧数)与真实列控数据传输时延之间的关系模型。(2)针对普遍应用在C3列控系统中的三类主流通信终端,利用(1)中得到的关系模型,通过干扰测试数据对比分析其在列控数据传输性能上的差别。为实际应用中通信终端的选择提供参考,同时对GSM-R网络动态检测工作的有效开展提出建议。(3)研究并解决了CSD传输时延测试中的持续丢帧问题,对现有GSM-R网络通信检测系统中的缺陷提出改进建议。3、研究数据挖掘技术在C3降级故障分析中的应用,提出C3降级故障类别自动诊断系统整体框架及实现流程,对系统实现中的三大关键技术进行研究并给出解决方案。(1)C3降级故障表示模型:通过对大量C3降级故障案例的研究分析,归纳总结出19种典型车地通信中断类型及其判断依据,在此基础上建立降级类别划分体系。从接口监测数据中提取描述C3降级故障的特征属性,作为条件属性集;以C3降级故障类别体系作为决策属性集,构成基于接口监测数据的C3降级故障表示模型。(2)建立C3降级故障类别自动诊断模型:提出基于C4.5决策树的C3降级故障类别自动诊断算法模型,并应用基于条件信息熵的决策表约简算法进一步提高分类准确率。在Matlab平台上进行了算法实现,用实际发生的C3降级故障案例训练自诊断分类器,并对分类准确率进行验证。结果表明,该算法的分类准确率可达98.579%(±0.0009),可以很好地解决C3降级故障类别自动诊断问题。(3)C3降级故障类别自动诊断模型的更新:采用决策树算法可通过更新训练分类器所用的C3降级故障案例库,重新运行算法即可实现自动诊断分类模型的更新。本文的研究工作为解决GSM-R网络测试综合评价、C3列控系统降级分析等重点难点问题提供了新方法、新思路。