论文部分内容阅读
近年来,以交通拥堵为代表的城市交通问题普遍成为困扰各大城市的难题。为了缓解交通拥堵问题,增加城市交通的供给量、大力发展智能交通系统成为了主要的解决途径。作为智能交通系统的重要指标,公交行程时间预测受到了越多越多学者的广泛关注。目前这些研究主要集中在使用传统的预测方法和基于少数几维的机器学习预测方法,例如基于卡尔曼滤波模型和基于支持向量机模型的行程时间预测方法。而现今的交通状况同以往相比无论是在数据量上还是在非线性和动态性等公共交通特点上均有极大差异性,因此公交行程时间预测问题还有很大的研究空间。基于给定相关数据,对不同公交线路上的城市公共交通的行程时间进行预测即本文所研究的公交行程时间预测问题。准确获悉公交行程时间,能够为智能交通系统提供有效信息,提高智能交通系统的调度优化水平,从而缓解交通拥堵问题。针对公交行程时间预测问题,本文首先分析了其影响因素;再根据影响因素选取了合适的源数据并进行数据预处理和特征分析,接着通过数据挖掘方式构建了多类特征集,分别为:基本特征集、历史统计特征集、天气特征集、利用K-means获取的聚类特征集和利用滑动时间窗获取的滑窗特征集;之后利用上述特征设计了基于梯度提升决策回归树模型(GBRT)和轻量型的梯度提升决策回归树模型(LightGBM)的公交行程时间预测方法。最后以某市的实际公交GPS数据和天气数据作为实验对象,构建了预测模型。实验结果证明,整体而言两种方法的预测结果都不错,基于LightGBM的预测方法结果稍微会更好;同时LightGBM的训练速度会更快,非常适合用于大数据的预测,能够为智能交通系统的指挥调度提供帮助。