论文部分内容阅读
数据挖掘(Data Mining,DM)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。由于数据挖掘是一个多领域交叉的研究与应用领域,所以备受关注,成为目前具有挑战意义的研究热点之一。 聚类(Clustering)分析是数据挖掘的重要方法之一,也是人类活动的一个重要内容。作为统计学的一个分支,聚类分析已有多年的研究历史。本文进一步探讨聚类分析中的一些算法,针对船舶航线设计的特点,提出了k-means算法与基于密度方法、自组织竞争神经网络相结合的聚类分析方法,进而又提出复合聚类分析算法和改进的复合聚类分析算法,将它们进行分析比较,改进的复合聚类分析算法的聚类效果最好。在船舶航线的设计中,首先在从世界船位分布图上取出部分数据,再对这些数据进行预处理,然后采用改进的复合聚类分析算法,计算凝聚点,最后再求取平均密度中心点,将这些密度中心点相连便是航线。 人工神经网络(ANN)也是数据挖掘的重要方法之一,神经网络具有通过学习后可以任意逼近非线性映射的能力,而且神经网络不受非线性系统模型的限制,便于工程实现。但现在神经网络时序预测模型的输入只能是单属性的,只能进行一维预测,对于多属性事物的预测还未探究。本文提出一种基于并行递归神经网络的多维预测模型,这种模型本身具有记忆过去所有输入信息的能力,网络输出是过去所有输入的某一非线性函数,实现的是一种非线性动态映射,而且可以实现对多属性事物的多维预测。本文将这种预测模型用于平面航线和三维空间螺旋曲线的预测,预测精度较高,预测效果较好。此外,本文还利用Matlab语言作了大量的仿真预测,获得了理想的仿真结果。 本文利用从GPS得来的数据,将聚类分析算法和多属性预测方法应用在GIS的数据挖掘中,得到一些有意义的结果。