论文部分内容阅读
机动车数量的迅猛增长与城市道路建设的限制造成了严重的道路供需矛盾,从而导致了拥堵情况的频繁发生。如何利用合适的历史交通流参数数据对交通拥堵情况进行精准快速地识别与预测,并通过识别和预测的结果及时采用合理的交通干预措施,是缓解交通拥堵的关键所在。目前网约车的蓬勃发展一方面在一定程度上解决了人们出行打车难的问题,另一方面网约车产生了大量的GPS定位点出行数据,这些数据具有数据量大、覆盖范围广、数据准确等优点,因此非常适合用于交通拥堵状态的研究当中。本文基于网约车市场占有率最大的滴滴出行提供的GPS定位点数据,通过分析数据特点并充分挖掘数据中蕴含的信息,结合机器学习等相关的先进算法,对GPS数据预处理与交通流参数提取、交通拥堵状态划分与识别、交通流参数预测等方面进行了研究。本文首先分析了网约车GPS数据存在的时序混乱、数据冗余、数据漂移等问题,针对这些问题进行了相应的处理,然后进一步进行了坐标转换、地图匹配等工作,对处理干净的GPS数据提取了单一路段的流量、速度、密度、时间延误指数四个交通流参数,针对提取的参数中存在的问题进一步进行了空白时段填补、小波去噪等处理。在上述处理之后,本文提出了一种基于Bagging集成的交通状态变化识别模型,该Bagging集成模型每次对原始交通状态变化数据集的70%数据进行随机自助采样,通过引入随机子空间方法进一步随机化数据集的特征子空间,并以kNN分类器算法作为基分类器。本文结合利用谱聚类、ADASYN过采样等算法构建了该模型使用的交通拥堵状态变化数据集,通过对比本文模型与其他模型在该数据集上的表现,可以发现本文模型交通状态变化识别的表现更好。此外,本文提出了一种基于GRU模块的多输入多输出交通流参数预测模型。本文通过分析预测需求期望构建多输入多输出交通流参数预测模型,而神经网络能够很好地进行多输入多输出预测,在考虑到GRU模型的特点后,本文使用GRU神经网络作为核心模块构建了具有输入层、隐藏层、输出层三层结构的交通流参数预测模型。该模型根据t时段的前k个时间段的交通流参数构成的多维特征,预测输出当前t时段的四维交通流参数。通过与其他模型的对比,发现本文构建的模型预测效果更好。