论文部分内容阅读
数据挖掘涉及到数据库、模式识别、神经网络、统计学、计算智能等相关技术,是当今国际上研究热点之一。空间数据挖掘是数据挖掘研究的一个重要研究方向,是从空间数据库中识别或提取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。聚类是数据挖掘中的一种非常重要的技术和方法。空间聚类分析既可以发现隐含在海量数据中的聚类规则,又可以与其它数据挖掘方法结合使用,发掘更深层次的知识,从而提高数据挖掘的效率和质量。空间聚类分析是空间数据挖掘的重要研究方向之一。本文主要工作如下:1.对空间数据挖掘进行了概述,简要介绍了空间数据挖掘的理论、方法和研究内容、发展趋势及方向,并指出当前空间数据挖掘技术中尚需解决的问题;2.阐述了聚类的概念,系统而完整地分析和总结了主要的空间数据聚类算法的性能、优缺点、计算复杂度以及各聚类算法的应用条件;3.在数据挖掘应用方面,电子科技大学计算智能实验室(CILab)数据挖掘小组研究开发了基于Web的数据挖掘服务系统-MinerOnWeb,提供在线的数据挖掘服务。本文介绍了MinerOnWeb的系统功能、特点、体系结构,详细地分析和讨论了EJB服务端、Web应用服务端的预处理模块的具体设计和实现过程;4.成功地设计和实现了MinerOnWeb系统的EJB服务端(系统核心模块),用于管理数据挖掘的数据对象和算法对象,完成算法运算。设计相关功能接口并具体实现,将接口提供给Web服务端;5.成功地设计和实现了Web应用服务的数据预处理模块,集成了一些常用的预处理算法,提供数据预处理的功能。解决了JSP页面中算法项的树型显示问题;6.针对高维复杂的空间数值数据,本文仔细分析了基于GHSOM网络的聚类算法,对自组织训练学习算法进行了优化,一定程度上提高了网络迭代训练的速度。详细阐述了该算法的实现,并将其集成到