论文部分内容阅读
轨迹是一种常见的时空数据,其从空间和时间维度描述了移动目标的运动信息。这些移动目标大多与人类行为相关,它们的轨迹中蕴含着人类行为在时间与空间上的规律。通过从轨迹数据中提取关于移动目标的时空模式,可以对指定时间和地区的重要目标进行身份识别、发现活动规律、监视运动状态、检测异常、识别意图和预测运动行为,从而支持人们对感兴趣目标进行分析、评估、管理与决策。移动目标轨迹挖掘的应用范围涵盖了人类行为分析、城市计算、交通物流、应急疏散管理、动物习性分析、市场营销、自然现象分析等诸多领域。此外,在国家安全领域,尤其是对于军事情报部门,移动目标轨迹时空模式挖掘技术是解决数据驱动的情报发现的一个有力工具。在当前数据急剧增长的时代,轨迹数据的挖掘和应用面临新的困难和问题:数据体量巨大、实时动态变化、数据维度高、数据来源多、数据粒度变化大、时空相关性高等等。轨迹数据的这一系列的特征对传统的数据分析与挖掘技术带来了挑战,人们从轨迹数据库中发现感兴趣知识的迫切需求推动着相关挖掘技术的迅速发展。本文针对从大量移动目标轨迹数据中挖掘时空模式的问题,充分考虑轨迹数据的特点,开展了一系列研究工作:首先,基于轨迹的分形特性,提出了一种高效及有效的算法提取轨迹形状模式以及进行轨迹的压缩表示,该算法的时间复杂度随轨迹中点的规模呈线性增长。与传统的通过角度计算来描述轨迹形状不同,该方法从分形几何的角度将轨迹的拓扑特征转化为多维形状向量,从而为应用机器学习技术处理轨迹数据提供支持,例如基于形状的轨迹聚类和分类。此外,本文首次对船舶轨迹自相似特征进行了检验和理论分析。其次,针对大规模轨迹的快速聚类和异常检测问题,提出了基于密度和距离的两阶段空间聚类算法KMDD。该算法可以快速发现大规模空间数据集中多种形状和密度的聚类,并且是首个使用基于密度和距离的概念来合并子聚类的方法。KMDD的聚类质量优于目前广泛使用的空间聚类算法,且运行时间仅仅是数据集规模和数据维度的线性函数。再次,提出了轨迹时空共现模式的概念及问题定义,并给出了问题的解决方法。本文提出通过求解二维和多维协同聚类模型来发现轨迹时空共现模式,针对真实船舶AIS轨迹,提出了船舶AIS数据处理框架,并从大量船舶轨迹数据中挖掘时空共现模式,以揭示船舶在多个维度上的协调一致的行为。最后,为了从轨迹数据中挖掘典型路径和典型时间、速度和方向,提出了基于区域序列与标注序列的频繁轨迹模式挖掘方法。现有频繁轨迹模式是基于时间标注的,而本文提出了两种新的频繁轨迹模式,即带速度、方向标注的频繁轨迹模式。为了挖掘这些频繁轨迹模式,提出了一种新的热点区域抽取方法,即转向区域抽取方法;此外,提出了邻接轨迹模式的概念和挖掘方法,以及提出了一种新的标注序列模式挖掘方法。实验验证了这一系列方法的可行性和效果。