论文部分内容阅读
随着城市人口规模的迅速增长,我国的城市轨道交通的压力也日益增加,并且随着城市经济的迅速发展,人们对于城市交通出行的依赖程度越来越高。地铁作为城市交通的主要工具,各个线路、站点的客流量规模不断攀升且呈现出较大差异。随之而来也产生了海量的地铁刷卡数据,这些数据对于构建高效、安全、便捷的交通出行有着至关重要的作用。机器学习领域中的算法可以从这些历史数据中预测出客流分布特点,快速和准确的对地铁短期客流进行预测。我们不仅需要了解地铁客流线路、站点的分布情况,更需要进一步的对线路各站点的客流量进行精确的预测。为解决上述问题,本文在众多学者的研究基础上进一步就短时地铁进出站客流预测中算法模型进行研究,聚焦杭州地铁短时客流预测问题,基于机器学习相关技术,研究设计了针对特征筛选和融合的机制构建有效特征,在此基础上提出短时客流预测的算法模型以实现精准短时客流预测,并对预测结果进行应用分析。核心任务包括两方面:一是特征工程的构建,二是预测模型的构建,主要研究成果如下:(1)研究并实现了基于随机森林算法结合长短时记忆网络模型的短时地铁客流预测。从数据集中多数特征中,筛选对预测结果影响较大的特征来进一步构建模型。该混合模型中,随机森林计算特征重要性并排序,充分抓取到重要特征。然后,构建在时间序列问题上表现优越的长短时记忆网络模型,LSTM对历史数据的时间关联性有很好的记忆功能,通过不断测试调优最终建立模型对短时地铁进出站客流进行准确预测。实验采用杭州地铁真实历史数据进行训练,实验结果表明,使用随机森林筛选的重要特征比人工特征在客流预测精度上表现出更好的效果,提出的组合预测模型预测结果较单独模型更加拟合真实的乘客流量,精度上有较大提升。(2)研究并实现了基于卷积神经网络结合轻量级梯度提升机的组合模型对短时地铁进出站乘客流量的预测。该组合模型中,CNN利用特征映射过程和降采样过程进行迭代数次来实现对时间序列数据中的有效特征自动提取,为接下来模型预测做特征准备。将原始特征和卷积神经网络自动提取特征融合成新的多维特征集,新特征集作为Light GBM的输入来进行有监督训练,通过不断的调参优化,最后得到CNN-Light GBM短时客流预测模型。对比实验表明,卷积神经网络结合Light GBM的组合模型在短时地铁客流上表现出更好的效果。基于以上的工作,本文对地铁客流预测结果的应用进行了深入的分析,提出预测结果可视化应用,以及地铁运营调度、运力协调、乘客出行方面的应用。