论文部分内容阅读
伴随着空间位置技术的广泛应用,空间数据挖掘成为数据挖掘中最有前景的研究方向之一,而空间co-location模式挖掘是发现一组频繁出现的空间对象的集合,是空间数据挖掘中重要的研究内容之一。目前,对空间co-location模式挖掘已经有相当多的研究成果,然而,这些成果是基于实例平等的思想,并不适用于所有的实际应用问题,其中“时间约束”就是一个导致不平等实例的重要因素。本文针对带时间约束的不平等空间实例,研究co-location模式的相关概念和挖掘算法。首先,对空间数据挖掘的基本概念、相关定义、特点、研究分类和研究成果作了介绍。其次,对co-location模式挖掘的相关概念作了概述,介绍了带稀有特征的co-location模式挖掘方法,并叙述了目前的研究现状。对三种算法作了详细地说明:基于全连接的co-location模式挖掘算法、Ujoin-based算法、挖掘top-k闭co-location模式算法。第三,给出了带时间约束的co-location模式的相关定义和定理,提出了两种带时间约束的co-location模式挖掘算法:基于全连接挖掘算法、top-κ挖掘算法。后者较前者省去了给出最小参与度阈值。对于这两个算法,都分别给出了优化策略,以提高算法的时间效率。第四,通过合成数据和实际数据,对算法进行了实验分析,对影响算法的各个参数进行分析,以得出各参数对算法的影响,并同时对比了优化后算法和基本算法,说明了优化策略的有效性。利用实际数据进行分析时,对利用TCjoin-based算法挖掘带时间约束的co-location频繁模式和利用join-based算法挖掘不带时间约束的co-location频繁模式结果进行了对比。最后为总结部分,对本文的内容作了简要的回顾,同时还指出了研究工作存在的不足,并对未来的研究做了展望,以期望在以后的工作中加以完善。