论文部分内容阅读
聚类分析作为一种非监督学习方法,是机器学习领域中的一个重要的研究方向。同时聚类技术也是数据挖掘中进行数据处理的重要分析工具和方法。近年来,随着人们对聚类技术的不断研究,聚类分析在机器学习、数据挖掘等很多领域已经成为人们进行数据分析和信息提取的研究热点。所谓聚类,就是把没有类别标记的样本集按某种准则划分成若干类,使类内样本的相似性尽可能大,而类间样本的相似性尽量小,是一种无监督的学习方法。聚类分析通常是在没有先验知识支持的前提下进行的,它所要解决的就是在这种前提下,实现满足要求的类的聚合。聚类分析的研究主要集中在聚类算法上,产生性能好而且实用的聚类算法是其终极目的。迄今为止,人们提出了很多种不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户,而且它们在理论和方法上仍不完善,甚至还有严重的不足之处。对聚类算法的进一步优化研究将不仅有助于算法理论的完善,更有助于算法的推广和应用。而引入模糊理论的模糊聚类分析为现实数据提供了模糊处理能力,在许多领域被广泛应用。在本文中,讨论了常用的模糊聚类算法,以及这些算法的优缺点、存在的问题以及前景展望。模糊C-均值聚类算法是目前广泛使用的模糊聚类算法,但它也存在一些缺点,如模糊C-均值聚类算法对初始值比较敏感,在迭代时容易陷入局部极小值等。本文对模糊聚类算法进行了改进:首先是在算法中引入模糊聚类有效性函数,对聚类数目c进行优选。而后又将模拟退火算法和粒子群算法应用到模糊聚类中,提出了一种基于模拟退火粒子群算法的模糊聚类算法。该算法能够利用粒子群算法强大的全局寻优能力和模拟退火算法跳出局部极值的能力,从而得到较好的聚类效果。为了证明改进的模糊C-均值聚类算法的实用性,将该算法应用于图像分割中。图像分割是从输入图像中提取目标或感兴趣区域的过程,是目标检测和识别过程中的重要步骤。模糊聚类是模糊理论的一个重要的分支,在图像分割中得到广泛应用。本文对应用模糊聚类的图像分割方法进行了探讨,主要研究内容如下:(1)给出一种将粒子群算法(PSO)与FCM聚类相结合的算法,可以减少初始聚类中心和隶属度矩阵的选取对算法收敛性的影响。依据FCM聚类算法建立目标函数,实现了基于PSO和FCM聚类的图像分割算法。(2)提出了将模拟退火粒子群算法(SA-PSO)与模糊C-均值聚类相结合的算法,并将其应用于图像分割中,实现了基于SA-PSO和FCM聚类的图像分割算法。尽管人们在图像分割研究方面做了许多工作,提出的算法数以千计,但至今仍无通用的分割算法,也不存在一个判断分割是否成功的客观标准。在众多的分割算法中,基于聚类分析的图像分割方法是图像分割领域中一类极其重要和应用相当广泛的算法,而聚类分析中用得最普遍的是模糊C-均值聚类。采用模糊C-均值聚类的方法进行图像分割,避免了阈值设定的问题,聚类过程中不需要任何人工的干预,对于图像分割自动化有重要的意义。将改进后的模糊C-均值聚类算法用于人工图像和实际图像的分割实验,实验结果表明该算法的有效性以及对噪声的鲁棒性。