论文部分内容阅读
随着我国城市轨道交通建设的快速发展,地铁轨道交通信息化水平的不断提高,地铁轨道交通各系统获取的数据量飞速增长且规模日渐庞大,如何对这些海量数据进行有效存储和分析并发挥这些海量数据价值越来越成为一个难题。面对正在增长的海量数据,传统数据处理方法存在数据存储成本过高、海量数据管理较困难、可靠性较低、效率低下、并行处理程序编写困难等诸多缺点,人们需要一种新的技术思想来解决这些问题。而如今,伴随着互联网和云计算的发展,互联网信息数据大爆炸,大数据时代到来,大数据技术将很好的解决这些类似的问题。云计算通过整合互联网络中的闲散资源,对外提供强大的存储和计算能力,以及一些其它解决方案。Hadoop是一个开源分布式数据处理框架,被用于高效地处理海量数据。由于Hadoop具有可伸缩性、高可靠性、低成本性和高效性等优点,已成为一种流行的云计算开发平台。通过Hadoop等云计算平台等应用,能够很好的解决地铁轨道交通的这些相关问题。本文的研究课题是基于大数据的武汉地铁轨道交通信息系统应用研究,主要目标是:结合当前地铁各类业务系统、信息系统的建设情况,以及地铁轨道交通生产应用需求,依托Hadoop云计算平台构建基于大数据的轨道交通数据挖掘平台,并对地铁轨道交通大数据的相关应用进行探索与研究分析。本文首先介绍了大数据相关背景,以及Hadoop、云计算等相关大数据平台,其次对地铁轨道交通各信息系统做了简单介绍分析,然后提出了基于Hadoop平台构想的地铁轨道交通大数据挖掘平台,使得地铁轨道交通系统处理海量数据的能力有很大提升。最后,基于搭建的地铁轨道交通数据挖掘平台,有针对性的提出了依托此数据平台的一些地铁轨道交通大数据分析应用探索与研究。