论文部分内容阅读
模糊C均值聚类算法(FCM,Fuzzy C-Means Clustering Algorithm)是非监督模式识别中应用最为广泛的算法之一,该算法是基于最小平方误差,并规定了每个样本对各个隶属度的和必须为1。然而,隶属度值并不总是与直观上的隶属度或兼容度相一致。而且,FCM对噪声点或孤立点都敏感。为了克服这些缺点,R. Krishnapuram和J.Keller于1993年通过放松FCM中的概率约束限制,重新建立了一个新的目标函数,而提出了可能性C均值聚类算法(PCM,Possibilistic C-Means Clustering Algorithm)。但是PCM算法容易趋向于一致聚类而且对初始化也敏感。现在我们将PCM算法和它的修改版分别记作PCM1算法和PCM2算法。为了解决PCM算法存在的问题,本文具体的研究内容可以分为以下三点内容:1.本文讨论已有的一些模糊聚类算法理论,包括硬C均值(HCM)聚类算法,模糊C均值(FCM)聚类算法,可能性C均值(PCM1)聚类算法,第二种可能性C均值聚类算法,记为PCM2算法,并对它们进行了实验模拟分析和比较。2.在PCM2算法中,它没有涉及到任何加权指数,当产生一致性聚类结果时,不能调整任何参数来得到可选择的聚类。为了克服PCM2的缺点,Zhang和Leung在FCM和PCM2的基础上提出了改进型可能性C均值聚类(Improved Possibilistic C-Means Clustering Algorithm, IPCM2 )。IPCM2解决了FCM对噪声敏感和PCM2一致性聚类的缺点,但是FCM、PCM2和IPCM2的目标函数中使用的是欧式距离,在现实中,这种情况是不存在的。于是本文提出了一种新的改进型可能性C均值聚类(NIPCM2 ),即一种基于非欧式距离的可能性C均值聚类。同时,实验结果表明NIPCM2能够克服噪声敏感问题和获得更好的聚类中心。3.本文提出了一种基于核函数的混合C均值聚类算法(Hybrid C-Means clusteringalgorithm based on the Kernel function, HKCM)。首先利用FCM和PCM2算法的优点,设计出一种混合的C均值聚类算法。然而鉴于该算法存在的不足,本文将Mercer核函数引入到该算法中,这样就可以更好地进行聚类。仿真试验结果证实了该方法的可行性和有效性。