论文部分内容阅读
聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区别不同的事物并认识事物间的相似性,而每个概念的最初形成无不借助于事物的聚类分析。因此,聚类分析的研究不仅具有重要的理论意义,也具有重要的工程应用价值和人文价值。传统的C-均值聚类算法思想简单,易于实现,而且运行速度快,内存消耗小,能有效地处理大数据集,是目前最常用的聚类算法之一。但是它们存在两个主要的缺点:对初始划分矩阵敏感和容易陷入局部极小值。为了解决上述问题,本文研究了基于改进粒子群算法的C-均值聚类算法。首先对粒子群算法做了部分改进,将加速系数的取值和惯性权重结合起来,提出了一种具有沿折线先增后减惯性权重的粒子群算法,可以从理论上保证该粒子群算法的收敛性。然后将这一改进的粒子群算法引入到C-均值聚类算法中,以增加隶属度矩阵的初始化多样性,解决C-均值聚类算法对初值的敏感问题,避免算法容易陷入局部极小值。仿真实验验证了该算法的有效性,实验比较结果表明,该算法比单一使用C-均值聚类算法的聚类效果更好。