论文部分内容阅读
随着全球定位系统GPS以及无线蜂窝网、无线通信等定位技术的快速发展和普及,人们可以方便地获取移动对象的位置信息和使用基于位置的服务,并将对象的移动过程以行迹的形式记录下来。移动对象的行迹数据中蕴含大量的有用信息,可用于分析人类行为、交通拥塞、城市规划、自然现象的进化等。因此,近年来行迹挖掘技术受到了广大学者的关注,并在智能交通、城市规划、购物、旅游等领域得到了广泛的应用。 论文通过分析行迹挖掘的典型方法和相关技术,针对基于GPS数据的频繁行迹挖掘方法开展了探索工作,主要包括行迹数据聚类、行迹转换和频繁行迹挖掘三个方面。 在频繁行迹挖掘中,由于受限于定位设备的精度,会产生位置模糊性问题,即定位设备在不同时间对同一位置进行定位时,得到的两个坐标值并不会完全相同,会存在一定的差异,这就导致两条行迹序列不能直接进行对比。针对这一问题,本文提出了一种基于动态方格划分-合并限制的行迹数据聚类方法(DynamicBoundMethod),该方法首先将对象的行迹空间动态地划分成大小相等的方格;然后将对象的行迹映射到这些方格中,并用方格id来代表落入该方格内的所有点,计算每个方格的密度,根据给定的最小支持度阈值,找出所有的频繁方格;最后根据给定的界限函数,将频繁方格合并成频繁区域。 在找出所有的频繁区域之后,本论文提出一种新的转换规则TCC,将把对象的行迹转换为由频繁区域id组成的序列集合。TCC考虑了对象在两个连续区域之间的运行时间t,认为如果t小于某一时间阈值τ,那么这两个区域之间存在唯一的一条路径。 最后,本论文提出了三种算法来挖掘频繁行迹,即:基于序列模式挖掘算法GSP和Prefixspan的频繁行迹挖掘算法和基于FP-tree的频繁行迹挖掘算法FPFTM。