论文部分内容阅读
随着基于不确定数据进行数据挖掘和知识发现的研究的深入,这种更加符合客观实际的理论方法越来越成为近年来研究的热点。空间数据固有信息的海量性和复杂性使得传统的数据查询处理技术难以有效地发挥作用。因此如何改善各种高效的空间对象查询处理技术是当前空间数据库研究领域有待解决的问题。针对空间数据的最近邻查询问题提出以来,不管是在空间数据挖掘理论研究领域还是各种前沿的实际应用范围中,相关的研究都在不断发展和延伸,从而更好地解决我们实际生活中所面临的查询问题。至今人们提出了多种利用不同空间索引结构进行空间数据库查询的算法,其中大多数都是基于R树索引结构的最近邻查询算法。由于当前的这些查询算法均为确定数据下的最近邻查询,用来解决不确定数据的最近邻查询问题则存在着诸多局限性,难以应用到空间不确定数据挖掘的相关领域。在当前国内外研究报告中,涉及连续不确定对象最近邻查询相关方面的工作非常有限,还没有形成较为完整的理论体系以及较为成熟的算法支持。本文在分析并总结当前最近邻查询问题的研究现状与方法以及不确定空间数据挖掘理论的基础上,结合了一种当前较为高效的概念划分网格的思想,提出一种采用树形结构来索引概念划分网格的连续最近邻查询算法,通过一系列改进步骤,提升了这一算法的查询效率。并在此基础上将此算法进一步拓展,延伸到基于不确定空间对象的连续最近邻查询问题中,提出了一种新的能够解决不确定空间数据中连续最近邻查询的思路和方法。并在试验中验证了此方法的正确性和有效性。本文的主要贡献可概括如下:1)提出一种以树形结构来索引概念划分网格的方法。2)设计了一种效率更高的最近邻查询算法T-CPM算法,相比经典的算法优化了网格的检索顺序并节省了计算代价。3)提出了一种基于概念划分的不确定数据下连续最近邻查询的思路和方法。