论文部分内容阅读
近年来,随着定位技术、传感器技术及跟踪监测设备的发展和普及,人们可以容易地对移动物体进行跟踪,并将它们的运动轨迹记录下来。运动对象的轨迹数据中包含大量有用的信息,采用数据挖掘技术对获取到的轨迹信息进行分析处理,可以发现数据中隐藏的关系和规则,并对移动对象未来的运动情况进行预测等。本文研究的目标就是对道路网络空间中的移动对象的轨迹进行分析和挖掘,聚类相似轨迹得到移动对象的运动特征和模式,为路径规划和智能导航等服务提供依据。移动对象在道路网络中连续运动,将随时间持续地产生轨迹,而对轨迹的聚类请求却可能发生在任意时间,每次请求时路网中的轨迹都发生了变化。传统的聚类方法处理的都是静态的数据集,而用于动态的轨迹聚类时,每次都要把所有轨迹重新处理一次,包括已经处理过的轨迹段,会浪费很多不必要的开销。本文正是基于以上提出的问题,对现有方法进行分析和总结,提出了以下方法对移动对象轨迹数据进行聚类:首先,提出了一种基于道路网络空间的移动对象轨迹的表示方法。以离散的点的方式表示一条轨迹,记录了在某时刻移动对象在路网上的真实位置信息,而且包括对象经过每点时的速度,能反映出移动对象在路网上位置变化的真实情况;其次,考虑轨迹的时空特性对轨迹间距离进行计算。在分析和总结了现有的轨迹距离函数和轨迹相似性度量计算方法的基础上,本文采用平均值的Hausdorff距离进行轨迹空间距离的计算,对于轨迹上的两点计算其网络距离而不使用欧氏距离,然后用时间距离对轨迹进行提纯,从而得到轨迹的时空距离作为聚类的依据:第三,提出了一种轨迹的增量聚类算法INC_CLUS进行轨迹聚类。采用基于密度的聚类方法,首先在初始时刻对现有轨迹进行初始聚类,得到一组初始聚类簇,然后对新增加的或发生变化的轨迹进行增量聚类,更新初始聚类簇得到最终的聚类结果,同时由于考虑了轨迹的时间信息,可以区分出不同时间段内的相似轨迹;最后,通过实验对哈尔滨市区的一块路网区域进行了分析存储,并模拟了一组移动对象在真实的道路网络空间中运动的轨迹数据,对其使用本文提出的增量轨迹聚类算法进行聚类,并与原始的DBSCAN算法进行比较,从聚类结果和运行时间的性能评估方面验证了所提INC_CLUS算法的正确性和有效性。