论文部分内容阅读
轨迹主要由动态地理信息构成。轨迹建模和预测研究一直是地理学与GIS的热点方向,也是时空数据挖掘领域的重要议题之一,对解读人类行为模式、解决城市交通问题、探索无人驾驶技术等研究具有重要意义。近年来,随着“数据密集型”科学范式的发展,深度学习方法被诸多轨迹建模研究所采用,以帮助从不规则的轨迹数据中获取能够反映轨迹数据内在规律的向量表征,并用于提高轨迹分类或预测的准确性,且在交通拥堵识别、城市功能区分类、个体位置预测等方向取得了一定的成果。然而,现有的深度学习方法较少关注动态地理数据受时空变化规律的影响。与图像、语音等数据不同,轨迹数据随着时间和空间的变化而不断变化。一方面,轨迹节点之间邻近或远程的依赖关系,其深层次的规律较难直接从轨迹原始数据中充分学习。另一方面,轨迹时空演变过程还受到多种时空特征的影响,研究这些特征与轨迹表征模型的融合方式,不仅有助于提升模型的预测能力,更有助于从地理学视角去审视和探讨轨迹表征所呈现的地理空间规律,为轨迹时空过程的理解提供新的科学研究方法。本文以道路网络空间中的轨迹为研究对象。基于轨迹表征建模方法研究不足的现状,研究轨迹时空特征的构成,包括轨迹坐标序列、不同尺度下的远近依赖关系,以及时间、空间、运动和环境等先验时空特征。在此基础上,研究了顾及远近依赖的轨迹表征建模方法与融合先验时空特征的轨迹表征建模方法。基于典型的出租车轨迹数据,设计了相关实验验证了模型的有效性与适用性。本文的主要研究内容和结论如下:(1)研究了轨迹表征建模的相关理论基础。论述了轨迹的基本概念和定义、时空变化过程,以及时空特征的构成,并给出轨迹表征建模的问题定义,阐述了轨迹表征向量的定义、获取方法与评价方法。在此基础上,提出了轨迹节点间的远近依赖关系的获取方法,并论述了轨迹的时间特征、空间特征、运动特征和环境特征的计算方法。(2)研究了顾及远近依赖的轨迹表征建模方法。基于轨迹节点之间的邻近依赖和远程依赖关系,提出了顾及远近依赖的轨迹表征建模方法。实验结果表明:(1)顾及远近依赖的轨迹表征模型在多项评价指标的对比中优于其他模型,且能够同时捕获邻近和远程依赖关系;(2)通过模型获得的轨迹表征向量学习到了两种依赖关系所代表的地理含义,且轨迹表征向量的相似度可以用于近似表达地理位置之间的空间关系。(3)研究了融合先验特征的轨迹表征建模方法。提出了三种模型来获取轨迹表征向量:轨迹节点先验时空特征的学习模型、轨迹全局先验时空特征的学习模型,以及融合以上特征的联合训练模型。设计了实验用于对比三个模型的性能和差异。实验结果表明,联合训练模型具备最好的性能与较为稳定的优势,并且在特征表达和预测性能上,体现了节点与全局两类特征的结合;此外,轨迹表征向量能够表征轨迹的空间聚集性、道路及路线信息,以及能够获取特征之间更深层的组合与规律。(4)研究了轨迹表征向量的适用性评价。通过与一个简单的三层神经网络集成,验证了轨迹表征向量的集成与泛化能力;基于预测误差在轨迹样本特征、空间分布上的差异分析了方法的空间适用性,并进一步探索了轨迹表征向量的地学内涵。实验结果表明:(1)一条不完整的前序轨迹可以被转换为包含一定完整轨迹信息的轨迹表征向量,并可作为其他模型的输入,在较小的样本集上取得较好的预测效果;(2)轨迹表征向量的表征能力在长度较长或完成度较高的轨迹中表现更好;(3)轨迹表征向量有较为广泛的轨迹类型适用性和空间适用性;(4)全局先验时空特征有助于轨迹表征向量在空间上的泛化,节点时空特征有助于轨迹表征在轨迹密集区域适用性的强化。本文通过引入表征建模的相关理论,融合地理学特征和深度学习方法,改进了模型对远近依赖关系和先验时空特征这两种时空特征的捕捉和表达能力,并通过实验分析了轨迹表征向量的适用性。本文从地理学视角出发,将轨迹时空特征与表征学习方法相结合,研究结果有望为揭示轨迹的表征向量和时空变化规律之间的内在联系提供新的科学研究方法。