基于梯度提升决策回归树的公交行程时间预测方法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lfshiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以交通拥堵为代表的城市交通问题普遍成为困扰各大城市的难题。为了缓解交通拥堵问题,增加城市交通的供给量、大力发展智能交通系统成为了主要的解决途径。作为智能交通系统的重要指标,公交行程时间预测受到了越多越多学者的广泛关注。目前这些研究主要集中在使用传统的预测方法和基于少数几维的机器学习预测方法,例如基于卡尔曼滤波模型和基于支持向量机模型的行程时间预测方法。而现今的交通状况同以往相比无论是在数据量上还是在非线性和动态性等公共交通特点上均有极大差异性,因此公交行程时间预测问题还有很大的研究空间。基于给定相关数据,对不同公交线路上的城市公共交通的行程时间进行预测即本文所研究的公交行程时间预测问题。准确获悉公交行程时间,能够为智能交通系统提供有效信息,提高智能交通系统的调度优化水平,从而缓解交通拥堵问题。针对公交行程时间预测问题,本文首先分析了其影响因素;再根据影响因素选取了合适的源数据并进行数据预处理和特征分析,接着通过数据挖掘方式构建了多类特征集,分别为:基本特征集、历史统计特征集、天气特征集、利用K-means获取的聚类特征集和利用滑动时间窗获取的滑窗特征集;之后利用上述特征设计了基于梯度提升决策回归树模型(GBRT)和轻量型的梯度提升决策回归树模型(LightGBM)的公交行程时间预测方法。最后以某市的实际公交GPS数据和天气数据作为实验对象,构建了预测模型。实验结果证明,整体而言两种方法的预测结果都不错,基于LightGBM的预测方法结果稍微会更好;同时LightGBM的训练速度会更快,非常适合用于大数据的预测,能够为智能交通系统的指挥调度提供帮助。
其他文献
<正> 万用表是在电气测量与检修工作中必不可少的仪表、由于频繁使用,部分型号的万用表在没有误用的情况下,会出现内部短路故障,除了电表本身损坏之外,还有可能损坏被测量的
<正> 根据本人长期电气工作经验看,2003年第6期&#39;读者信箱&#39;《接触器不失电的原因》应当是:控制电压用交流380V和控制线路过长(780m),此处应考虑长电缆的电容电流对接
结合招生形势逆转时期河南省高等职业教育发展的现状,对当前存在的生源质量持续下降、社会对高等职业教育的认可度降低等问题进行探讨,提出加强政府宏观调控和主导作用、探索