论文部分内容阅读
空间聚类作为空间数据挖掘领域的重要研究分支,旨针对空间数据的复杂性和特殊性,发现客观世界中大量存在的空间实体之间潜在的集聚模式,解决传统聚类挖掘所无法处理的问题,进而揭示空间实体的分布规律。空间聚类已广泛应用于实际生活中的各个方面,在全球气候变化、公共卫生安全等众多领域具有重要的应用价值。对于空间聚类而言,当面对复杂多变的空间分布模式以及顾及空间数据专题属性相似性时,如何实现自适应的空间聚类挖掘是本文研究的关键内容之所在。因此,本文提出一种新颖的基于多密度树的空间聚类算法和改进的基于场论的双重空间聚类算法,以解决上述问题。本文的主要研究内容和研究成果如下:(1)鉴于空间数据的基本特征,对空间对象之间存在的空间关系以及潜在的空间尺度的特点进行探讨,发现和归纳空间聚类与传统聚类挖掘的区别和联系,为空间聚类算法的设计及其实现提供理论依据。并在此基础上,对空间聚类分析的过程作进一步地阐释和说明。(2)针对当前空间聚类算法难以有效处理类簇密度变化不均匀、空间分布复杂的不足,本文采用混合思想的空间聚类方式,提出一种基于多密度树的空间聚类算法(SCMDOT)。其主要思想是:将密度峰值理论与层次、密度、图论的聚类思想相结合,通过多密度树融合生长的构树策略形成和扩展类簇,并将簇内相似性度量指标与簇间连接性指标相结合,共同作为子簇合并的标准。SCMDOT的时间复杂度约为O(Nlog(N))。通过实验证明,该算法不仅能够满足密度自适应和发现任意形状类簇的要求,而且可以适应复杂多变的空间分布模式。(3)为实现可以同时顾及空间连续性和专题属性相似性的空间聚类算法,本文对传统空间聚类算法处理空间实体专题属性的方式做出进一步的改进,提出一种改进的基于场论的双重空间聚类算法(FTDSC)。其主要思想是:首先利用基于图论的边长约束准则构建空间对象之间的拓扑邻近关系,之后将物理学场论思想融入到专题属性域的处理过程,根据空间数据场内实体之间专题属性的差异产生相互凝聚力,并通过递归搜索的策略进一步实现空间簇的细分。对比实验结果表明,该算法可以保证空间聚类结果满足空间邻近且专题属性相似的要求。(4)利用上述所研究设计的空间聚类方法和技术,开展南京市餐饮业空间分布格局的应用研究,并结合应用背景对空间聚类结果进行解释和阐述。结果表明,本文提出的空间聚类算法具备处理实际问题的能力,有助于深入理解城市餐饮产业的集聚特征规律以及驱动成因。