论文部分内容阅读
轨迹数据获取方式多样、灵活,且覆盖面广,成为行为模式分析最常用的数据来源。掌握隐藏在轨迹数据中的目标行为规律并作出预测,在物流运输、公共交通、船舶管理等领域具有广泛应用,因此具有重要的研究意义。轨迹数据蕴含了丰富的目标行为模式信息,能够以多种方式表征目标行为。其中最为常见的两种为以按时间排序的位置序列表示的个体目标移动模式,和以随时间变化的区域内目标数量表示的群体目标行为模式。然而,轨迹数据的冗余性增加了存储、传输和可视化成本,降低了行为分析方法的效率。同时轨迹的时空连续性和不确定性为目标行为的表征和学习增加了难度。此外,轨迹数据表示的目标行为具有强时间相关性,且受到多种因素影响,使行为模式分析变得更加困难。 本文首先针对轨迹冗余性问题,对获取轨迹时如何高效、高质量地进行数据压缩进行了研究。其次,针对轨迹数据连续性和不确定性的问题,对如何利用轨迹数据更有效地表征个体与群体目标行为进行了分析。第三,针对目标行为的时间相关性问题,对如何构建能够有效利用轨迹数据的深度神经网络模型进行了探索。最后,针对影响目标行为的特征多样性问题,对如何在深度神经网络模型中加入更多特征进行了研究。 论文的主要工作和研究成果总结如下: 1.提出了一种基于图模型的最优离线轨迹压缩算法(OPTTS)。通过将轨迹转化为图结构,利用广度优先搜索,边再生算法和单源最短路径搜索算法,求得给定条件下具有最小点数和最小压缩误差的最优压缩解,解决了传统方法压缩误差较大的问题。同时,针对实时服务的需求,提出了一种基于图模型的近最优实时轨迹压缩算法(OLTS)。该算法沿用最优化算法的框架,通过动态构建轨迹图、实时最小化近似误差和实时输出方法,能够高效实时地压缩轨迹流数据,并获得近似最优解,较传统在线压缩方法具有更低的压缩误差。在真实轨迹数据集上的实验结果表明,OPTTS较传统的离线压缩算法,减少了43.9%的压缩近似误差。OLTS较传统在线压缩算法,减少了13.6%的近似误差。 2.提出了一种基于时空语义神经网络模型的个体目标位置预测算法。首先,为了解决传统方法无法表征区域间或道路上的行为的问题,利用一种基于时空语义映射的轨迹表征算法,将轨迹转化为由离散的固定点组成的位置序列,能够完整、准确地表征目标行为。其次,针对传统模型无法利用目标长期行为对当前位置影响的问题,利用长短时记忆网络(LSTM)构建位置预测模型,能够有效结合历史行为与当前位置进行预测。实验结果表明,轨迹表征方法较传统网格表征方法降低了82%的偏移距离,生成的序列能够提升27%的预测准确率。LSTM预测模型较传统组合梯度提升树(XGBoost)模型提升了25%的预测正确率,较循环神经网络模型(RNN)提升了14.7%的正确率。 3.提出了一种基于多特征融合模型的群体目标出行量预测算法。为了解决传统区域划分方法无法有效表征区域行为的问题,综合考虑出行量、区域属性和地理信息等特征对细小网格聚类,能够得到目标行为规律较为一致的区域,更好地表征目标行为。其次,针对传统回归模型无法有效利用长期时间、天气、兴趣点分布等影响目标出行的特征的问题,本文采用一种基于多特征时间序列的融合模型进行预测,能够综合不同模型特点,有效利用影响目标出行的多种特征,提升预测准确率。实验结果表明,区域分割算法较传统基于道路的分割方法,能够得到更有效表征目标出行量的区域,降低了24.3%的预测误差。同时,融合模型较传统梯度回归树(GBRT)模型,降低了17.8%的预测误差。