论文部分内容阅读
随着位置感知与移动计算技术的进步,以智能手机为代表的一系列移动终端设备在人们的生产生活中越来越普及,各种基于位置的服务也应运而生,为人们带来了极大的便利。人们在享受服务的同时,大量位置数据也相伴而生。这些数据中隐含着移动对象的个性与共性特征,使研究人员分析其中的规律,从而进一步改善人类生活,提高社会生产效率成为可能。然而,社会对于轨迹数据的挖掘还处于一个初级探索阶段,数据的有效利用率并不高。本文围绕轨迹数据的差异性与普遍性两方面的内容,在现有研究的基础上,对轨迹的异常检测与聚类做了进一步的研究。本文的主要工作如下:(1)基于隔离机制的轨迹异常检测研究。现有的轨迹异常检测算法大多只考虑到了轨迹点的空间特征,仅能检测出一些位置异常的静态点,且参数设置复杂,缺乏实际应用价值。因此,本文从多因素的角度出发,提出了一种基于隔离机制的轨迹异常检测算法。首先,从划分后的子轨迹中提取出空间维特征和时间维特征,然后运用孤立森林模型,对多因素特征进行融合,得出异常值。最后,运用箱形图对异常值进行分析,得出异常阈值及异常子轨迹。通过在真实的轨迹数据集上进行实验,并与人工标记和经典TRAOD算法两种结果对比,验证了算法的有效性。(2)基于不确定性的轨迹聚类研究。现有的轨迹聚类算法大多没有考虑到由采集误差导致的轨迹点的不确定性,且缺乏对用户隐私的保护。因此,本文从轨迹点的不确定性出发,提出了一种基于不确定性的轨迹聚类算法。首先,利用Geohash技术将划分后的子轨迹离散化,然后通过改进的编辑距离计算距离矩阵,最后采用扩展后的DBSCAN算法对轨迹进行聚类。通过在真实的动物轨迹和飓风轨迹数据集上进行实验,验证了算法的有效性。(3)轨迹采集与分析系统的设计与实现。现有的基于位置的应用大多没有对轨迹数据进行深入挖掘,学术成果与工程应用难以有效结合。因此,本文在算法研究的基础上,设计并实现了一种轨迹数据采集与分析系统。该系统可以采集移动端上传的轨迹数据,分析人员将采集到的数据整理后,可调用系统中的算法接口对轨迹数据进行分析。