基于深度学习的行程时间估计方法研究

来源 :湖南大学 | 被引量 : 2次 | 上传用户:figo0204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车保有量的迅速增加,出行需求的持续增长,道路的供需矛盾日益尖锐,这不仅给交通管理者带来了巨大的压力,而且给出行者造成了极大的不便。实时、准确的路网行程时间数据能够为交通管理者配置交通资源以及出行者制定出行计划提供必要的信息支持。因此,路网行程时间估计对交通管理者和出行者来说具有重要的现实意义。近年来,随着智慧城市建设的迅速开展,GPS等定位设备广泛普及,各类移动应用层出不穷,为行程时间信息的获取提供了丰富的数据。与此同时,以深度学习为代表的数据处理技术也取得了长足的进步。在此背景下,以汽车的GPS轨迹数据为数据源,本文旨在利用深度学习技术对城市路网的行程时间估计展开深入研究。GPS轨迹数据在提供广阔区域的交通信息的同时,也对如何高效利用这一数据规模巨大且稀疏的数据源提出了极大的挑战。另外,由于城市路网交通状况的复杂性,在对行程时间进行建模的过程中不仅需要高性能的模型,而且要充分考虑路网层面的时空相关性。鉴于此,以GPS轨迹数据为数据源的行程时间估计应该解决以下问题:海量数据的处理;数据稀疏导致的数据缺失;高性能模型的构建;时空相关性分析;解决方案的实施。基于以上问题,本文以GPS轨迹数据为数据源,以行程时间估计为主线,结合实际交通数据提出了具体的解决方案,并开发了相应的软件应用系统。本文的主要研究内容及成果如下:(1)基于生成对抗网络的路网行程时间数据补全尽管GPS轨迹数据量庞大,但是对于复杂、庞大的城市交通路网来说这些数据依然是稀疏的,这将导致路网行程时间信息的缺失。因此,本文构建了行程时间补全生成对抗网络(Travel Time Imputation Generative Adversarial Networks,TTI-GAN)模型,为行程时间估计相关研究提供完备的数据。该模型基于行程时间在路网层面的时空相关性,通过拟合GPS轨迹数据丰富路段的行程时间分布为数据缺失路段生成准确的行程时间数据。为了分析行程时间在路网层面上的时空相关性,本文利用Skip-Gram神经网络模型对道路的结构信息及其时空演变信息进行编码,生成TTI-GAN模型可用的低维语义向量。此外,为了对复杂路网中路段行程时间分布进行有效地建模,本文引入了基于单变量Wasserstein距离的动态聚类(Dynamic Clustering with Univariable Wasserstein Distance,DC-UWD)算法对路段行程时间数据进行了聚类分析。该算法能够在综合考虑概率分布的均值、标准差和形状的情况下准确地将路段行程时间分布划分到恰当的聚类中。根据聚类标签,TTI-GAN模型能够高效地学习路段行程时间的异质性,提高模型性能。(2)基于多任务学习模型的路段平均行程时间预测基于TTI-GAN补全的行程时间数据,本文构建了面向路网的路段平均行程时间预测模型:多任务学习时间卷积神经网络(Multi-Task Learning Temporal Convolutional Neural Network,MTL-TCNN),以期在考虑时空相关性的情况下进行短时路段行程时间预测。在MTL-TCNN模型中,时间卷积神经网络(TCNN)通过将扩张因果卷积(Dilated Causal Convolutions)和残差映射(Residual Mappings)相结合,能够对时间序列数据进行高效地建模。此外,为了给MTL-TCNN模型选择最有益的输入特征,本文提出了时空动态时间扭曲(Spatiotemporal Dynamic Time Warping,ST-DTW)算法来量化预测任务之间的相关性。(3)基于改进的信息最大化生成对抗网络的行程时间分布估计路段平均行程时间能够为人们的出行提供直接、有效的路况信息,但无法反映路网交通状况的多样性。因此,以TTI-GAN补全的行程时间数据为数据源,本文提出了行程时间分布估计方法,并通过改进信息最大化生成对抗网络(Information Maximizing Generative Adversarial Networks,InfoGAN)构建了行程信息最大化生成对抗网络(Trip Information Maximizing Generative Adversarial Networks,T-InfoGAN)模型。对于行程时间分布估计,研究重点不仅在于分析路段行程时间数据,更要掌握路段间交通状态的转换规律。为此,本文利用基于多变量Wasserstein距离的动态聚类(Dynamic Clustering with Multivariable Wasserstein Distance,DC-MWD)算法对路段之间交通状态的转换进行了深入研究,以帮助T-InfoGAN模型准确地学习交通状态的转换规律。此外,TInfoGAN模型在估计行程时间分布的过程中无需假设行程时间数据的概率分布类型,具有较好的泛化性和灵活性。(4)行程时间估计软件系统开发以汽车GPS轨迹数据为数据源,本文为路网行程时间估计开发了端到端的软件应用系统,即行程时间估计系统(Travel Time Estimation System,TTES)。该系统采用C#、Python和R语言以混合语言编程的方式为用户提供了地图显示、GPS轨迹数据加载和显示、矢量地图下载、地图匹配、行程时间提取、缺失数据补全、行程时间预测、行程时间分布估计、路径规划和路况预测等功能。TTES实现了本文提出的行程时间估计解决方案,并通过来自不同城市的实际数据验证了该方案的有效性和可实施性。
其他文献
以长汀县为研究区,运用GIS空间分析功能,通过构建南方丘陵区土地开发建设适宜性评价体系,采用限制系数评价模型,开展土地开发建设适宜性评价,全面掌握长汀县当前土地资源开发
全球范围内生态退化形势严峻,生态技术在遏制生态退化进程中发挥着重要作用。长期以来,对生态技术缺乏系统研究和评价,影响了其在脆弱生态区生态治理中的应用与推广。"生态技
一直以来,医疗器械产业都拥有着较高的利润。近年来,巨大的市场潜力使得更多的竞争者参与其中,市场竞争变得更加的白热化。就目前来看,大多数的医疗器械公司还是按照渠道管理
目的对于患有缺血性心脏病的患者在围术期间自身血氧饱和度减少的相关护理干预措施进行调查和分析。方法选取我院2014年10月~2015年10月收容诊治的50名患有缺血性心脏病在围
期刊
科学技术和互联网通信技术的发展,使得电子商务经济迅速发展壮大。电子商务具有的跨区域和跨时间优势与国际贸易的发展需求不谋而合。在国际贸易中电子商务的应用也逐步深入
医疗保险是社会保障体系的重要组成部分,对保障人民身体健康、提高全民健康水平、抵御疾病经济风险等方面有重要作用。医疗保险支付制度是医疗保险的实现方式,其合理性直接影
在科学工程与计算中,对偏微分方程数值解的研究具有非常实际的应用意义。对于许多难以获得精确解的偏微分方程,求出它的数值解,并且口以利用,是研究与实际应用的重要课题。抛
类黄酮是一类重要的次生代谢物,而花青素是最为熟知的类黄酮。干旱条件下,类黄酮(特别是花青素)大量合成,所以一般认为花青素能提高植物的抗旱能力。迄今,有关类黄酮抗逆功能
包皮环切术主要用于治疗包皮过长和包茎,术后发生阴茎皮肤或部分阴茎坏死在临床上较为罕见。在近几年中,我们共诊治2例,现报道如下。 Circumcision is mainly used for the