论文部分内容阅读
在当前大数据背景下,通过对各类数据的深入分析和挖掘,可以掌握人类活动的行为模式,进而探索人类活动的客观规律,成为一个解决城市问题的重要途径,其中浮动车GPS轨迹数据作为地理信息环境中社会数据的主要表现形式之一,可以从个体的视角研究群体的空间移动规律,提供了新的数据支撑和研究思路。通过轨迹数据发掘人类的移动规律和活动模式,进而探求蕴含的深层次知识,是解决城市问题的重要途径。通过对大量的GPS轨迹数据的统计特征与聚类分析,可以发现城市中出行者的出行时空特征和模式,从一定程度上感知城市韵律性,挖掘人类的社会活动记录,了解城市交通的热点区域,对城市的建设、交通规划提供合理性建议。本文将使用浮动车GPS轨迹数据进行统计特征与聚类分析,主要内容体现在以下几个方面:(1)进行数据预处理。原始数据为2015年5月11日至5月17日一周时间里北京市3万多辆出租车的3.85亿条轨迹数据,在SQL Server中对数据进行预处理,得到可供实验使用的5千多万条有效数据。(2)对轨迹数据进行统计特征分析。对与处理之后的载客段数据从距离、长周期时间、单轨迹时间、方向等方面进行统计特征分析,研究出租车行驶距离、时间的概率分布模型并进行拟合,结果发现距离、单轨迹时间出行所具有的距离衰减效应和重尾效应,揭示了城市居民在工作日和周末的出行特点,发现长周期时间中隐藏的日韵律性,通过统计计算载客段轨迹的线性方向平均值,发现其与城市道路交通规划之间的关系。(3)对轨迹数据进行聚类分析。选择轨迹的最长公共子序列(LCSS)作相似性度量基础,分别对5.13(工作日)和5.16(周末)的12:00-14:00(午高峰)、17:00-19:00(晚高峰)的数据进行处理,并采用基于密度的DBSCAN聚类,确定交通流集群在空间的分布模式,发现其大部分在中心城区聚集、小部分向周边城区扩散的特性,并对不同时段的交通流集群进行对比分析,研究交通流集群的演化特征,结果表明午高峰时交通流主要表现为中心城区内部的流动,晚高峰时交通流主要表现为中心城区向四周发散的流动,周末相对于工作日聚类集群分布更为稀疏。