论文部分内容阅读
随着经济的快速发展和城市人口的不断增加,城市正在不断地扩大,地铁网络作为城市交通方式发挥着越来越重要的作用。每个人在空间里的移动看似是随机且没有规律的,然而对于一个较大规模人群的移动例如地铁网络中人群的移动却存在着特定的模式。为了研究智能交通、传染病传播等问题,可以从个体行为移动性出发,挖掘人类移动模式。交通网络作为一种复杂网络,可以很好的用来研究人类移动性,因此对于大规模人群移动中隐藏的特定的模式可以通过交通网络例如地铁网络进行研究,从而挖掘城市地铁交通模式,用来支持城市规划、交通规划、公共卫生、社交网络等的相应的决策。因此,对于城市地铁交通模式的研究是至关重要的。随着社会和互联网的发展以及云时代的来临,大数据得到人们的广泛关注,对于大数据的研究和应用也日益成熟起来。对于交通网络例如地铁网络的研究其基础是交通数据以及交通数据的采集方法和处理方法。随着城市智能交通系统的发展,新的追踪技术,例如全球定位系统、交通传感器等,得以应用使得人类在大城市的移动性可以以高分辨率被追踪,也必然会产生大规模的交通数据。对于城市交通大数据,可以使用大数据平台对其进行处理和计算。本文主要是针对上海交通大数据,基于Hadoop大数据平台对上海市民一卡通乘车数据进行处理。本文搭建了Hadoop大数据平台,进行Hadoop单机/伪分布式安装配置以及集群安装配置,并可以Web查看节点信息以及追踪任务进度等。将交通大数据放在HDFS系统上进行分析处理,本文所搭建的Hadoop大数据平台具有很强大的计算处理能力,可以很好的对本文的大规模实验数据上海市民一卡通乘车数据进行处理。本文首先构建地铁站点一卡通乘客接触矩阵,表示上海313个站点之间的客流量交互。研究地铁交通模式主要从社区分析和行为稳定性分析来进行研究,根据该矩阵,来进行社区发现和行为熵测定。社区分析方面,不同于直观地域上的上海地区区域,根据客流量重新定义新的社区概念,表示社区的状态,社区发现对于理解复杂网络结构并从中获取有用的信息或者模式是非常重要的,本文通过经典的社区发现算法将上海地铁站点划分为不同的社区,并挖掘社区之间的交互模式,社区内部联系紧密,外部稀疏。从地铁线站点角度来看,若干条地铁线可能处于相同的社区,从区域角度来看,若干个地区可能关联到同一个社区。可以将其应用于功能区检测,预警检测等方面。行为分析方面,本文主要是基于乘客乘坐地铁的统计量来分析其行为稳定性,本文使用行为熵来测度人类行为,基于大数据平台Hadoop计算上海地铁一卡通乘客每天的行为熵,发现乘客行为熵的值具有一定的周期性,即乘客行为稳定性具有一定的周期性。这两方面的分析结果对于城市规划、交通规划等相应的决策起到了至关重要的作用。