论文部分内容阅读
随着车联网的发展,行驶在路上的车辆生成了海量的交通行为数据。这些数据通常有两种存在形式,一种是车牌自动识别数据,这种数据包含了车辆本身的信息和车辆与路网交互的信息。车辆自身的信息包括车牌号码、车辆颜色和车辆类型等信息,交互信息包括卡口摄像头、卡口的名称和卡口的经纬度等信息。另一种和车辆相关的数据是GPS(Global Positioning System)数据,这些数据是由车辆自身携带的相关设备实时产生的,这类数据记录了车辆的行驶轨迹。针对这两种交通数据进行车辆行为挖掘可以帮助相关部门及时发现车辆异常行为或者对异常事件进行事后追责。车辆异常行为有多种,其中,同行车辆是比较明显的一种,通过同行车辆的挖掘可以对车辆行驶行为进行更深入的了解,同时也可以对跟踪车辆行为进行预防,对于防止和发现车辆犯罪行为有很大帮助。然而,交通网络结构复杂,交通数据量级巨大,如何及时准确地发现同行车辆组成为了当前亟待解决的问题。为解决相关问题,本文从两种交通数据出发,基于车牌识别数据建立了动态图计算同行车辆实时发现模型。基于GPS数据提出了TSWMD(Time Sensitive Mover’s Distance),TSWMD算法并通过轨迹相似度和轨迹聚类来高效挖掘同行车辆组。本论文的主要研究工作如下:1.本文针对轨迹数据对卡口进行角色划分。首先,将卡口作为节点,由车辆行驶轨迹获取路网结构图,应用改进的PageRank算法得到卡口的二维属性,通过卡口属性聚类对卡口进行角色划分。其次,将卡口角色作为静态分离的约束条件加入车辆动态图中有效降低图形计算过程中的复杂度。最后以车辆作为节点,同行关系作为边,来建立有效的图计算关系,通过Spark Streaming和Spark GrpaphX建立动态图计算模型来实时挖掘同行车辆组。2.本文通过引入自然语言处理中的上下文思想,将车牌信息映射到高维空间,利用Node2vec算法计算车辆轨迹相似度。并提出了TSWMD算法,得到车辆轨迹的距离矩阵,通过对车辆轨迹进行聚类来挖掘同行车辆组。实验结果表明,本文建立的算法模型对于挖掘同行车辆是行之有效的。