论文部分内容阅读
近年来,随着绿色、健康、共享出行理念的提出,公共自行车系统获得了蓬勃发展。截至2018年底,全球有1000多个城市建立了公共自行车系统。该系统具有绿色、低碳、环保等特点,可以有效的解决人们短途出行以及交通衔接等问题;缓解城市交通运输工具的高负荷压力;减轻交通拥堵、汽车尾气污染等问题。虽然该系统具有许多优点,但是一些存在的问题仍旧困扰着消费者和管理者。对于消费者而言,由于居民出行需求的多样性导致自行车在时间和空间上分布不均衡,进而造成了用户用车难的问题。对于管理者而言,由于现有的车辆调度方法存在时间上的滞后性,因此当调度车到达指定地点后,站点的需求往往已经发生改变。本文以公共自行车系统为研究对象,综合运用统计学与网络科学的理论和方法,对公共自行车系统的特点与网络特征进行初步研究,如下:首先,本文从Citi Bike系统官网获取了原始数据,并利用python软件对数据进行预处理。通过删除原始数据集中不完整、有误以及多余的数据集,得到质量较高的数据集。通过对处理后的数据进行了统计分析,以便了解纽约公共自行车系统的使用特点。通过编写程序求得每个站点一天24个时刻中自行车的流入和流出的时间序列,为后续站点聚类研究做好数据准备。其次,对公共自行车系统的站点进行了聚类研究,旨在探讨不同类型站点的使用模式与地理位置之间的影响。本文提出了归一化自行车净流出作为新的聚类指标。已有的研究所采用的聚类指标,依赖于站点的静态数据,对站点故障不敏感,造成聚类结果存在偏差。新的聚类指标能够动态描述站点使用状态,并且剔除了故障车辆和车桩等因素造成的误差。利用K-means聚类方法对站点的时间序列数据进行聚类,并将聚类结果进行空间展示。再次,已有的关于公共自行车系统的复杂网络建模研究中,有的没有考虑到连边的方向或者权重,有的忽略了连边的时间属性。在本文中,以公共自行车站点作为网络节点,站点间的骑行线路作为有向边,站点之间的客流量人次作为连边的权重构建了流量加权有向网络。以公共自行车站点作为网络节点,站点间的骑行线路作为有向边,每条线路上的骑行平均耗时作为连边的权重构建了时间加权有向网络。这两个网络模型都考虑到了连边的方向,并且考虑了客流量和时间对网络模型的影响,能够更加真实的反映网络的实际情况。由于网络具备有向并且加权的属性,因此在本文提出了强度差分布的概念和单位强度分布的概念来描述网络的拓扑特征。针对不同的加权有向网络,强度差分布与单位强度分布能够分别描述不同的实际含义。对于流量加权有向网络,强度差分布能够反映站点客流量进出的情况。单位强度分布描述了单个连边的客流输送能力。对于时间加权有向网络,单位强度分布能够分析居民骑行的时间规律。最后,流量加权有向网络中,节点之间的连边会随着时间的变化而发生断开和连接,因此流量加权有向网络属于典型的时序网络。通过选择不同的时间窗口划分方法,分析了流量加权有向网络的时序特征,了解时序网络在一周和一天当中的变化情况。此外,选取最大连通子图相对大小和平均路径长度作为鲁棒性评价指标,分析了流量加权有向网络的鲁棒性。