论文部分内容阅读
近些年来,随着大数据技术与机器学习方法的兴起,以用户的个人出行行为为核心,融合大数据与机器学习方法,从非集计的角度深入了解用户的交通需求受到了学者们的广泛关注。机器学习方法与传统统计方法相比,更能提高采样的范围,揭示用户数据之间的内在联系;从非集计的角度出发,能够更好的掌握用户的出行规律与出行特征,了解交通需求的差异性,为乘客设计符合其需求的公交方案。大数据及机器学习算法为公交运营带来了新的挑战与机遇,本文以大数据与机器学习算法为切入点,提出了公交的乘客出行特征分析方法、建立了公交线路站点客流量预测模型、设计了基于预测数据的公交行车方案。具体内容如下:(1)公共交通乘客出行特征分析。本文从用户个人交通行为出发,分析了乘客的交通出行特征。在此过程中,将乘客的公交卡数据进行出行重构,形成乘客出行的完整出行链。运用基于密度与噪声的聚类算法(DBSCAN)分析了公交乘客的时空出行规律,并将乘客分为规律出行乘客与非规律出行乘客两大类。针对这两类乘客,具体分析了他们出行的时间与空间偏好。为观察非集计乘客交通行为的聚集效果,本文提出了基于节点重要度的公交站点聚类方法,将公交站点进行聚类形成无交集区域,分析了典型区域的客流特征与区域之间的客流联系。(2)公交站点客流量预测。为满足多线路与单线路公交客流预测的不同需求,本文基于机器学习中的X推进树(Xgboost)算法与长短时记忆网络(LSTM)算法,分别提出了多线路客流预测模型与单线路高精度客流预测模型。多线路客流预测模型为融合兴趣点数据的Xgboost客流预测模型(XPPM-POI)。多线路客流预测要求模型在精度以及效率之间进行平衡,即在能够接受的时间范围内进行模型的建模以及迭代。因此本文选择Xgboost作为多线路客流预测的核心算法以加快模型的训练速度,并将兴趣点数据加入到模型中提高数据维度,增加模型的准确性。对于单线路客流预测问题,在进行乘客出行规律分析后进一步提出了考虑兴趣点乘客出行特征的LSTM客流预测模型(LPPM-TC)。单线路客流预测由于输入的数据量较少,因此主要以提高预测精度为目标,因此本文选择了能够考虑之前数据对预测数据影响的长短时记忆网络模型作为核心算法。为提高预测精度LPPM-TC模型除使用兴趣点数据外,还通过对乘客进行分组的方法,扩充了所求参数数量,提高模型的准确度。因此,LPPM-TC模型的组织更复杂,适用于单线路客流预测,而XPPM-POI模型组织相对简单,能够满足多线路的客流预测准确性以及效率的需求。本文通过与历史均值模型以及支持向量机(SVM)等模型的对比,验证了所提出模型的优秀性能,并分析了不同模型在客流数据预测上的优缺点。在XPPM-POI模型训练的过程中,标定了公交站点为周围兴趣点的最佳查询半径并计算了不同类型的兴趣点对于XPPM-POI的影响。(3)公交行车方案设计。在实际生产生活中,公交公司通常要设计不同的运营计划,在大数据以及机器学习算法的帮助下,实时进行公交计划的设计与快速变更成为了可能,因此本文应用大数据技术与机器学习算法对较复杂的换乘协调问题及区间车问题进行了深入研究。基于本文提出的客流预测模型,分别建立了实时换乘协调公交运营组织(RTTBO)模型以及多周期区间车公交运营组织(MPSBO)模型。RTTBO模型以XPPM-POI模型为数据输入,能够实时进行多条线路乘客数量的预测,通过建立乘客出行概率网络实时更新换乘乘客数量,以换乘协调为目的进行实时换乘协调计划的更新。模型包括客流量预测、乘客换成概率预测、通行时间计算以及最优化模型四个部分,客流量预测部分以XPPM-POI模型为基础,乘客换乘概率预测部分建立了计算乘客换乘概率的神经网络(ANTPP)模型,达到实时获取换乘乘客数量的目的,通行时间计算以历史均值模型为基础,最优化部分则是以公交线路的总成本最低以及乘客总出行时间最小为目标建立多目标优化模型。MPSBO模型则以设计不同周期的区间车计划为目的,能够为不同周期的公交计划产生不同的区间车方案。该模型以LPPM-TC模型为输入,能够输出包括月计划、周计划与小时计划三种周期的区间车计划。每种计划包括,以LPPM-TC模型为基础的客流量预测部分,以历史均值模型为基础的通行时间计算部分,以及以最优化为基础的发车方案设计部分。为求解不同MPSBO模型以及RTTBO模型,本文分别设计了考虑法定发车间隔的最优化模型快速解法以及考虑不同优化目标权重模型的遗传算法,寻找公交运营组织优化问题的最优解。通过与现有计划以及现有研究方法的对比,验证了MPSBO模型以及RTTBO模型的优越性。