论文部分内容阅读
随着计算机技术和空间信息理论的快速发展,移动对象产生的轨迹数据规模呈爆炸式增长,轨迹数据传输速度、存储以及隐私保护需求越来越迫切。轨迹数据概化技术作为轨迹数据挖掘的一个重要分支,通过轨迹数据概化,能够满足用户在轨迹数据压缩、隐私保护以及多粒度分析等方面的应用需求。本文围绕轨迹数据概化进行了研究,主要工作如下:(1)轨迹数据多因素概化方法针对目前轨迹数据概化大多只考虑空间位置因素,导致概化轨迹精度降低且概化结果较为局限的问题,提出了轨迹数据多因素概化方法(TRMGEN)。首先,根据轨迹点位置、速度、加速度、转角等多个特征,进行轨迹点多因素聚类(TPM-DBSCAN)。其次,针对TPM-DBSCAN中聚类特征的选择,计算信息增益和特征之间的关联性进行优化。最后,为衡量轨迹数据概化效果,一方面引入信息丢失的概念来计算概化轨迹在形状上与原始轨迹的差异;另一方面以轨迹聚类为例,计算概化轨迹与原始轨迹聚类结果的相似性。飓风数据实验表明,TRMGEN生成的概化轨迹较好地保留了移动对象基本的运动特征,同时概化轨迹应用于轨迹聚类可以缩减聚类时间,得到准确有效的结果。(2)基于迭代划分和差异性重构的轨迹数据概化方法针对现有使用聚类方法划分空间带来的效率问题,和均匀网格划分运动空间进行轨迹概化方法的缺陷,提出了基于迭代划分和差异性重构的轨迹数据轨迹概化方法(TRGEN-SIPDR)。首先,根据轨迹点分布情况对运动平面做迭代划分(SIP)。然后,考虑时间约束,合并轨迹在连续时间内多次往复通过的邻接区域。最后,为了满足移动对象对概化程度的不同需求,提出概化轨迹差异性重构方法。飓风轨迹数据实验表明,TRGEN-SIPDR方法能够得到更具适应性的轨迹概化结果。从多个角度对TRGEN-SIPDR和TRMGEN进行比较分析表明:二者都实现了轨迹概化的基本功能;不同之处主要体现在TRMGEN将多因素应用于轨迹概化,而TRGEN-SIPDR使用差异性重构,支持用户灵活控制概化程度。(3)设计并实现轨迹数据概化分析原型系统在理论研究的基础上,设计并实现了轨迹数据概化原型系统。针对不同轨迹数据,提供多种方法,并且能够从信息丢失和概化轨迹聚类两方面对概化的结果进行评估。提供良好的参数输入接口和可视化效果,并呈现轨迹概化结果。