论文部分内容阅读
在模糊聚类分析中,模糊c-均值算法(FCM)可以说是应用最为广泛、最为灵敏的一种算法。但是它的一个致命弱点就是对初始化非常敏感而容易陷入局部极小值,而遗传算法是一种应用广泛的全局优化方法,它的主要优点是简单、通用、鲁棒性强和适合并行处理,因此把遗传算法与FCM结合起来,既能发挥遗传算法的全局寻优能力,又可以兼顾FCM的局部寻优能力,同时可提高收敛速度,从而更好地解决聚类问题。 本文主要对遗传算法与FCM算法相结合的混合聚类算法进行了研究,提出了改进的遗传模糊聚类算法(GFGA),来提高收敛速度并改善分类效果。首先,本文使用把聚类中心作为染色体的浮点数编码方式,这样既能使大数据集的编码过程得到简化,又能减少整个算法的运算量;第二方面,为了保证每一代的进化过程中当前最优个体不会被遗传操作所破坏,所以在进行选择时采用最优保存策略与比例法相结合的混合选择算子;第三方面,在交叉操作中,为了减少无意义个体的产生,先对配对个体进行了基于最短距离的基因匹配,然后再运用算术交叉来增强遗传算法的局部搜索能力;最后,为了提高收敛速度,在每一代遗传操作结束之前对要进入下一代的群体进行了FCM优化,使搜索最优解的速度明显加快。本文还运用MATLAB进行了仿真实验,来证明GFGA在大数据集及图像边缘检测中都能得到良好的应用。 此外,本文还在GFGA算法的基础上,提出了基于遗传算法的快速模糊聚类算法(GMRFCM),这种算法实际上是一种基于遗传算法的多阶段随机取样的模糊c-均值聚类算法,它通过多阶段过程在整个数据集的子集上寻找接近最优聚类中心的初始聚类中心,然后在整个数据集上运用GFGA来聚类。由于这种方法运用的是接近最优聚类中心的初始聚类中心,因此可以在很大程度上提高收敛速度,在处理大数据集时是一种很有效的方法。