面向动车组运维的多源数据预处理关键技术研究与实现

来源 :北京交通大学 | 被引量 : 9次 | 上传用户:slyde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国高速铁路网络的不断延伸,动车组质量和运维效率的关注度也在不断提高。为了更全面而准确的进行分析,就需要结合多个数据源的信息,从不同的业务系统中获取更全面更丰富的有关动车组运维的数据,用来支撑复杂的分析。然而由于多源数据中有着数据量大、异构、多维、多尺度、不同步、不完整等问题,所以在分析这些多源数据前,如何对多源数据进行预处理成为一个难题。因此,本文针对面向高速铁路动车组运维分析中,多源数据中存在的各种问题,研究多源数据预处理的相关技术与动车组运维分析相结合的方案。提出一套完整的面向动车组运维的多源数据预处理体系,将分布在不同数据源的数据处理成格式统一,清晰,完整,意义明确的数据,从而为动车组运维的相关研究和分析打下坚实的基础。本论文的主要工作包括以下三点:(1)研究数据预处理的相关理论和方法,包括常规数据预处理和多源数据预处理两种情景,总结出多源数据预处理中的主要任务。基于此,深入研究和分析动车组运维分析中多源数据的情况以及多源数据预处理存在的问题。(2)针对动车组运维的多源数据预处理中存在的问题提出具体的解决方案,并提出一套完整的面向动车组运维的多源数据预处理体系。对于其中难以处理的不同步、不完整问题提出 FCSPM(Fast Convergence Sequence Pattern Mining)算法进行解决。通过实验对比,证明该算法取得了比其他相似算法更好的处理效果。(3)最后根据现有动车组车地信息系统现状,在不改动现有信息系统的情况下,实现了基于Kafka的车载监测数据在线预处理功能,取得了良好的效果。
其他文献
<正> 《中国法制史》课程是法律学科类法学专业(专科)的选修课。教材使用蒲坚主编、光明日报社出版的《中国法制史》;参考教材是蒲坚主编、中央广播电视大学出版社出版的《中
随着国家经济的快速发展,很多地方都加强了对畜牧技术的推广.畜牧业是我国重点发展的产业,对地方的建设、经济发展和社会稳定,会产生一定的影响.文章针对畜牧技术推广中存在
1.发价2.提单3.信用证4.委付二、填空1.国际贸易统一法的两个渊源__和__。
乌克兰危机的爆发,起源于2013年11月乌克兰总统亚努科维奇宣布暂停与欧盟签署联系国协定。作为欧盟"东方伙伴关系"计划的核心组成部分,联系国协定一旦签署,将为伙伴国与成员
平面向量是高中新课标的重要内容,具有代数形式和几何形式的双重身份,是中学数学知识的一个重要交汇点,常与函数、三角、解析几何等内容交叉渗透,使数学问题的情境新颖别致,自然流
目的探讨培美曲塞联合顺铂二线治疗晚期肺腺癌临床价值和用药安全性。方法通过将本院2008年1月至2012年7月32例晚期肺腺癌患者随机分成两组,观察组16例使用培美曲塞500 mg/m2
针对目前大学物理课程教学中存在的具体问题,提出将思维导图这种可视化思维工具运用到大学物理教学中进行辅助教学,阐述了大学物理教学中运用思维导图的可行性,并结合实例介
随着信息化社会的快速发展,互联网中的数据量急速增长。由于传统存储模式难以突破其存储限制,分布式存储系统便越来越受欢迎,其中HDFS(Hadoop Distributed File System)是目
随着我国教育事业现代化发展进程的加快,高校学生教育问题成为了教育部门关注的重点,因为在社会发展背景下我国高校学生人数与日俱增,并且高校的教育意义也发生了变化,传统高
把分析化学实验课的教学过程归纳成:备课、预做实验、指导预习、课前提问、讲解、操作、观察和记录数据及总结等环节,有利于分析化学实验课的教学研究。