论文部分内容阅读
智能交通系统(intelligent transportation system,ITS)能够产生两类典型的实时交通大数据:一类是GPS数据,另一类是车牌识别流式数据(automatic number plate recognition data,ANPR)。从实时交通大数据中发现车辆的伴随关系已经成为国内外的研究热点,该研究可以应用到交通管理,公安治理等领域。然而,实时的交通大数据具有连续产生、有序到达、无限增长和数据规模不可预知等特点,如何及时准确地从实时的交通大数据中发现伴随车组成为了当前亟待解决的问题。为解决相关问题,本论文从两类典型的实时交通大数据出发进行研究:基于车牌识别数据ANPR,提出一种基于增量计算的分布式伴随车即时发现方法;基于车载设备收集的GPS数据,提出一种基于时间敏感性的轨迹相似性度量算法实时挖掘伴随车组。本论文的主要研究工作和贡献如下:1.针对传统挖掘算法在处理大规模流式车牌识别数据ANPR时效率无法满足实时性要求的问题,本文提出一种针对流式车牌数据的增量挖掘算法。首先,将传统频繁模式增量挖掘算法进行改进向Spark计算模型迁移,实现并行的增量挖掘;其次,本文提出一种可动态调整的伴随车组结构DF-tree,采用自底向上的指针走向来搜索伴随车组,提高查询速度;最后,针对伴随车发现的时效性要求,提出一种时间加权计数的伴随车即时发现算法,最终实现基于大规模过车数据的伴随车即时发现。2.针对挖掘GPS实时轨迹数据时的实时性要求,本文提出一种基于时间敏感性的轨迹相似性度量算法实时挖掘伴随车组。首先,本文引入最小边界扇形(Minimum Bounding Sector,MBS)实时分割算法进行实时轨迹分段;然后,在传统DTW算法和LCSS算法基础上设计了时间敏感性自适应算法度量轨迹相似度;最后,采用分布式流数据处理框架Spark Streaming实现实时的GPS轨迹相似性度量算法,即时挖掘伴随车组。实验结果表明,本文建立的增量挖掘模型和时间敏感性轨迹相似性度量算法对及时、准确挖掘伴随车辆是行之有效的。