论文部分内容阅读
在城市中有大量的出租车,出租车流量预测问题与人们的生活息息相关,尤其是在一,二线城市,因出租车过多导致的道路拥堵严重影响着人们的工作生活,在上下班高峰期,该问题尤其明显,如果能准确地预测城市某区域的出租车流量,那么对于交通的疏导及出租车的调配是有极大指导意义的。如今深度学习模型具有强大的表征能力,可以将深度学习算法应用于交叉领域,如城市计算。本课题得益于公开的出租车流量数据,以此预测出未来某个时刻的出租车流量。在实际的预测场景中,模型还要考虑外部影响因素,如气温,降雨量,节假日,日期等,它们都会在一定程度上影响预测的准确度。本课题的相关工作以及研究成果如下:1)城市出租车流量预测模型设计:设计了两种出租车流量预测模型,分别基于卷积神经网络CNN模块与循环神经网络RNN模块,图卷积网络GCN模块与循环神经网络RNN模块,其中RNN模块使用BiLSTM模型,并都加入了时空注意力机制,考虑了外部影响因素。2)问题定义及数据集构建:分别定义了两种模型下的出租车流量预测问题。从美国纽约出租车网站收集2014年4月至2014年9月的黄,绿,Uber车出行数据,并收集到对应时段气温,降雨量,节假日,日期等外部影响因素数据。根据所设计两种模型分别整理了对应的数据集。3)横向对比实验:按照传统统计学习时间序列预测算法,机器学习回归算法,深度学习算法顺序将本课题所设计的两种模型与以往车流量预测所使用的模型进行横向对比,分析结果。4)纵向对比及显著性实验:进行纵向对比消融实验,将本课题所设计两种模型的时空注意力机制去除,以验证加入时空注意力机制是否能提升模型预测的准确度。并进一步进行显著性实验,验证实验结果的偶然性。5)外部影响因素及显著性实验:进行消融实验,在以卷积神经网络CNN模块与循环神经网络RNN模块为基础结构的模型中,不考虑外部影响因素,以验证加入外部影响因素是否能提升模型预测准确度。进一步进行显著性实验,验证实验结果偶然性。6)时间序列细粒度实验:进行时间序列细粒度实验,分析时间序列该取多长,使设计的模型不至过于复杂,并有一定的预测准确度。