论文部分内容阅读
云南省“三江并流”区域是世界生物多样性最丰富的地区之一,位居17个中国生物多样性保护“关键地区”的第一位;而且,“三江并流”植物数据类型复杂、与空间紧密相关,在空间数据仓库及空间数据挖掘技术的研究中具有很强的代表性。因此,研究“三江并流”代表性植物空间数据仓库和数据挖掘技术,不仅可以丰富和发展计算机学科的空间数据仓库及空间数据挖掘的理论与技术,而且可以促进云南省、西部乃至国家的生态环境保护及可持续发展。
首先,论文使用“三江并流"地区已有的一些植物分布数据,并根据需要设计了一些模拟数据,在这些数据的基础上,结合目前空间数据库的结构,设计了基于空间数据库SDE引擎的空间数据仓库的体系构架。经SDE引擎在空间数据库中实现了空间数据和属性数据的集成,并在此基础上构造了空间数据立方体,讨论了基于Web的数据仓库OLAP展示和空间地图展示,并做了相应实验。
其次,根据数据仓库OLAP特殊情况下的聚合值与各维信息熵的联系,提出了由OLAP驱动的数据仓库与数据挖掘结合的方法,把OLAP的结果很好地应用到数据挖掘中去。尽管我们在数据挖掘算法上以决策树算法做实验,但这种方法也可以很容易地推广到其它的数据挖掘算法。
第三,根据第一条中基于空间数据库的空间数据仓库模型给出了结合OLAP、DM、地图展示和空间数据库OLAM模型,并利用相关软件进行了可视化开发,实现了OLAP图表、挖掘结果、空间地图的展示。