论文部分内容阅读
随着汽车保有量的迅速增加,出行需求的持续增长,道路的供需矛盾日益尖锐,这不仅给交通管理者带来了巨大的压力,而且给出行者造成了极大的不便。实时、准确的路网行程时间数据能够为交通管理者配置交通资源以及出行者制定出行计划提供必要的信息支持。因此,路网行程时间估计对交通管理者和出行者来说具有重要的现实意义。近年来,随着智慧城市建设的迅速开展,GPS等定位设备广泛普及,各类移动应用层出不穷,为行程时间信息的获取提供了丰富的数据。与此同时,以深度学习为代表的数据处理技术也取得了长足的进步。在此背景下,以汽车的GPS轨迹数据为数据源,本文旨在利用深度学习技术对城市路网的行程时间估计展开深入研究。GPS轨迹数据在提供广阔区域的交通信息的同时,也对如何高效利用这一数据规模巨大且稀疏的数据源提出了极大的挑战。另外,由于城市路网交通状况的复杂性,在对行程时间进行建模的过程中不仅需要高性能的模型,而且要充分考虑路网层面的时空相关性。鉴于此,以GPS轨迹数据为数据源的行程时间估计应该解决以下问题:海量数据的处理;数据稀疏导致的数据缺失;高性能模型的构建;时空相关性分析;解决方案的实施。基于以上问题,本文以GPS轨迹数据为数据源,以行程时间估计为主线,结合实际交通数据提出了具体的解决方案,并开发了相应的软件应用系统。本文的主要研究内容及成果如下:(1)基于生成对抗网络的路网行程时间数据补全尽管GPS轨迹数据量庞大,但是对于复杂、庞大的城市交通路网来说这些数据依然是稀疏的,这将导致路网行程时间信息的缺失。因此,本文构建了行程时间补全生成对抗网络(Travel Time Imputation Generative Adversarial Networks,TTI-GAN)模型,为行程时间估计相关研究提供完备的数据。该模型基于行程时间在路网层面的时空相关性,通过拟合GPS轨迹数据丰富路段的行程时间分布为数据缺失路段生成准确的行程时间数据。为了分析行程时间在路网层面上的时空相关性,本文利用Skip-Gram神经网络模型对道路的结构信息及其时空演变信息进行编码,生成TTI-GAN模型可用的低维语义向量。此外,为了对复杂路网中路段行程时间分布进行有效地建模,本文引入了基于单变量Wasserstein距离的动态聚类(Dynamic Clustering with Univariable Wasserstein Distance,DC-UWD)算法对路段行程时间数据进行了聚类分析。该算法能够在综合考虑概率分布的均值、标准差和形状的情况下准确地将路段行程时间分布划分到恰当的聚类中。根据聚类标签,TTI-GAN模型能够高效地学习路段行程时间的异质性,提高模型性能。(2)基于多任务学习模型的路段平均行程时间预测基于TTI-GAN补全的行程时间数据,本文构建了面向路网的路段平均行程时间预测模型:多任务学习时间卷积神经网络(Multi-Task Learning Temporal Convolutional Neural Network,MTL-TCNN),以期在考虑时空相关性的情况下进行短时路段行程时间预测。在MTL-TCNN模型中,时间卷积神经网络(TCNN)通过将扩张因果卷积(Dilated Causal Convolutions)和残差映射(Residual Mappings)相结合,能够对时间序列数据进行高效地建模。此外,为了给MTL-TCNN模型选择最有益的输入特征,本文提出了时空动态时间扭曲(Spatiotemporal Dynamic Time Warping,ST-DTW)算法来量化预测任务之间的相关性。(3)基于改进的信息最大化生成对抗网络的行程时间分布估计路段平均行程时间能够为人们的出行提供直接、有效的路况信息,但无法反映路网交通状况的多样性。因此,以TTI-GAN补全的行程时间数据为数据源,本文提出了行程时间分布估计方法,并通过改进信息最大化生成对抗网络(Information Maximizing Generative Adversarial Networks,InfoGAN)构建了行程信息最大化生成对抗网络(Trip Information Maximizing Generative Adversarial Networks,T-InfoGAN)模型。对于行程时间分布估计,研究重点不仅在于分析路段行程时间数据,更要掌握路段间交通状态的转换规律。为此,本文利用基于多变量Wasserstein距离的动态聚类(Dynamic Clustering with Multivariable Wasserstein Distance,DC-MWD)算法对路段之间交通状态的转换进行了深入研究,以帮助T-InfoGAN模型准确地学习交通状态的转换规律。此外,TInfoGAN模型在估计行程时间分布的过程中无需假设行程时间数据的概率分布类型,具有较好的泛化性和灵活性。(4)行程时间估计软件系统开发以汽车GPS轨迹数据为数据源,本文为路网行程时间估计开发了端到端的软件应用系统,即行程时间估计系统(Travel Time Estimation System,TTES)。该系统采用C#、Python和R语言以混合语言编程的方式为用户提供了地图显示、GPS轨迹数据加载和显示、矢量地图下载、地图匹配、行程时间提取、缺失数据补全、行程时间预测、行程时间分布估计、路径规划和路况预测等功能。TTES实现了本文提出的行程时间估计解决方案,并通过来自不同城市的实际数据验证了该方案的有效性和可实施性。