论文部分内容阅读
数据挖掘是在海量的数据中提取隐含的、未知的、潜在有用的知识或信息模式的决策支持方法。在信息爆炸的今天,数据挖掘显得尤为重要。聚类分析是数据挖掘中的一个重要研究领域,它从数据库中寻找数据间的相似性,从而优化大规模数据库的查询和发现数据中隐含的有用信息和知识。
模糊C-均值聚类(FCM)算法是一种经典模糊聚类分析方法。但由于模糊聚类目标函数是一个非凸函数,算法容易陷入局部极值点和鞍点而得不到全局最优模糊划分。现有模糊C一均值聚类(FCM)算法都没有有效的解决这个问题,本文提出一种新颖的基于网格和密度的模糊C-均值聚类方法,先利用网格和密度找到样本的初始化聚类中心,然后在初始化聚类中心上进行聚类。大量实验分析表明:该算法与经典FCM聚类算法相比收敛速度更快,迭代步数更少,解决了容易陷入局部极值点和鞍点的问题。