论文部分内容阅读
政府土地主管部门通过土地利用现状调查和城镇地籍调查积累了大量第一手资料,但如何从中提取出人们感兴趣的有用信息是亟待解决的重要问题。本文通过对如何选取数据挖掘工具、如何选取数据挖掘算法、如何分析解释数据挖掘结果等问题的研究,在大量实验的基础上,结合实际案例对空间数据挖掘方法在土地空间数据中的应用作初步探讨。本文内容主要分为三大部分:第一部分介绍了选题依据、国内外研究现状、技术路线等内容;第二部分对文中所应用的数据挖掘算法进行重点介绍;第三部分为实例研究,选用不同的数据挖掘软件,选用各具特色的数据挖掘算法,分别对城市地籍数据和城镇土地利用结构数据进行挖掘分析得到如下结论:(1)城市地籍空间数据挖掘。以SQL Server 2000组件Analysis Manager软件为工作平台,采用决策树算法,对2000年济南市城区地籍资料进行数据挖掘操作。通过对数据挖掘产生的决策树进行分析,发现研究区域内的建筑容积率较低,说明该区域建设用地的利用程度不高,已开发建设用地还有很大的提高潜力。依据挖掘结果提出在今后的土地开发利用中应该将工作的重心放在内部挖潜、提高已有建设用地的利用效率上等建议。(2)城市建设用地结构分析。将基尼系数的基本原理引入到城市建设用地结构的研究中,构建了“城市建设用地结构基尼系数”的概念及其计算方法。借助GIS等手段对不同城市间建设用地结构的差异进行分析,结果显示:①以东部、中部、西部和东北部四个区域为单位计算出的同一地类城市建设用地结构基尼系数很小,但不同地类间差异较大,而且随时间变化呈现出不同的变化趋势;②大多数省份的城市建设用地结构基尼系数略有下降,说明我国整体的城市建设用地结构逐渐趋于合理化;③依据基尼系数的计算结果,与《城市用地分类与规划建设用地标准》(GBJ 137-90)进行了对比。研究结论:使用基尼系数衡量城市建设用地结构是一种行之有效的方法。(3)城市建设用地结构特征挖掘。尝试使用Weka软件,运用其关联分析、聚类、回归方法中的不同算法对城市建设用地结构进行分析,获取了一些有益的结果:①通过关联分析得到不同用地间的相关性;②通过聚类将全国城市分为5类,并分析了其空间分布特征,即存在均匀分布,又呈现相对聚集现象;③通过回归分析得知用地结构与城市规模之间存在一定联系。(4)初步建立了城镇用地结构数据挖掘的数据预处理、挖掘算法筛选、挖掘结果分析的技术流程。