论文部分内容阅读
伴随着云计算、大数据技术的快速发展和我国城市轨道交通建设的逐步推进,政府和城市居民对于城市公共交通智能化的需求日益迫切。通过对海量出行数据的分析研究,挖掘数据背后隐藏的重要信息,可以帮助运营管理部门及时进行工作调整,同时也可以引导出行者选择合理的出行时间和出行路径。对于智慧城市的发展建设有着重要推动作用。本文以城市轨道交通AFC系统(Automatic Fare Collection System)数据为基础,基于Hadoop大数据平台分析研究居民出行的时空特性,在此基础上针对现有短时客流预测模型的不足之处,构建混合预测模型。本文的主要研究内容和创新有以下几方面:(1)针对目前大多数特征提取算法无法提取数据深层特性的缺陷,引入SAE(Stacked Auto-encoder)网络,构建基于深层网络的特征提取模型,实现对站点客流特征的有效提取,并在此基础上应用K-means算法实现对站点类型的划分。经对比该模型划分效果远优于现有的站点类型划分方法。(2)在特征选择方面,突破传统的时间序列在特征选择方面的局限,针对客流数据易受外界因素干扰的特点和目前许多已有特征选择算法对训练集中的扰动较为敏感的缺陷,引入基于LARS(Least Angle Regression)算法的稳定性特征选择算法,从而使得有限样本的错误得到控制,提取出更为稳定的特征,提高模型的预测精度。(3)在预测模型构建方面,将GPR(Gaussian Process Regression)和KRR(Kernel Ridge Regression)引入城市轨道交通短时客流预测领域,在GPR进行客流预测的基础上,融合GPR的预测结果、预测结果的方差估计、节假日信息、站点类别信息,通过KRR算法实现对GPR预测结果的修正,在保证时间效率的基础上有效提高了预测精度。(4)借鉴道路交通指数的概念,设计了线网拥挤指数的计算方法。通过主成分分析法对断面客流特征进行提取并为每个断面赋予相应权重,加权得到最终线网拥挤指数,并根据线网拥挤指数实现对线网拥挤度的划分。线网拥挤指数可以有效反映出当前和未来线网的整体拥挤状态,对于管理者和出行者都有重要参考意义。