论文部分内容阅读
随着科学技术的迅速发展,国内大多数城市的出租车都配置了GPS终端,因此产生了大量的出租车轨迹数据。通过研究这些轨迹数据,可以帮助政府了解城市道路情况、交通资源和交通需求的分布、甚至道路与交通路线规划信息。本文主要通过出租车轨迹数据对出租车载客情况进行分析与可视化展示。本文以2011/04/18-2011/04/26这个时间段内、深圳市13798台出租车的车辆轨迹数据作为分析对象,这些数据中包含6天半的工作日数据和2天的节假日数据。本文研究出租车载客情况主要从时间和空间两个维度出发,时间上研究出租车载客高峰时间段,空间上研究出租车载客热点区域,同时每个维度又详细分为节假日和工作日进行研究。本文主要包括以下三部分内容。一为数据预处理:主要有数据过滤和数据处理,本文给出了四种数据过滤方法,分别是冗余数据检测、区域外数据的过滤、其他异常点数据过滤和滑动窗口数据检测,数据处理有两个方面:GPS坐标与地图道路的匹配处理;上下车信息的计算处理。二为载客情况分析:首先提出一个量化参数--载客次数,以此参数判断载客高峰时间段和载客热点区域。然后运用统计思想,以小时为单位划分每天每个时间段的载客次数,找出出租车在节假日和工作日的载客高峰时间段。在载客热点区域分析中,本文提出了交通小区的划分原则,将深圳市划分为20到50个交通小区,再采用本文提出的结合K-means算法与系统聚类法的方法模型对上下车位置点进行聚类分析,得到了20个交通小区的聚类中心点,并用“热度”概念标识这些交通小区。三为可视化表示:本文出租车载客高峰时间段以条形图和折线图的形式展示。出租车载客热点区域可视化借助ArcGIS平台,将经过数据预处理提取的上下车位置点和聚类分析得到的高热度、中热度、低热度载客区域中心点展示出来。并分别提取出节假日和工作日某天某个时间段的上下车位置点数据以散点图和热力图的形式可视化展示。