论文部分内容阅读
物以类聚,人以群分,聚类分析是一种常见的人类活动,其用途是十分广泛的,如应用在文本挖掘,图像处理等领域近邻传播聚类算法τAffinityPropagation clustering, APυ是Frey和Dueck在2007年发表于Science上的一种新型无监督聚类算法,该算法无需指定聚类个数,只需构造相似度矩阵,便可通过消息传递机制,自动确定合适的类代表点,并将其余数据分配到与其相似度最大的代表点所属的类别,最终使得所有数据与自己的类代表点相似度之和最大在AP算法中,初始时将相似度矩阵对角线上的偏向参数Preference设置为相同的值,表明所有数据成为类代表点的可能性相同,但是这种初始化设置方式是有缺陷的,因为当该数据点周围的数据个数越多时,它成为类代表点的可能性要大于那些周围数据个数少的数据点本文主要工作如下:首先,借鉴密度聚类的思想,统计每个数据点在其⒂邻域内所包含的数据个数,给出了一个设置Preference值的方法,从而提出了一种改进相似度矩阵的AP算法(Modified-Similarity basedAP, MSAP)其次,将MSAP算法应用于图像分割中,给出了利用图像的灰度直方图提取原图像中核心灰度值代替所有像素点作为聚类数据的方法,从而在保证数据质量的同时使数据规模大大降低,在此基础上,给出了MSAP算法用于图像分割中的相似度矩阵构造方法,同时,给出了一个新的准则作为分割效果的评价标准实验结果表明所提算法可以有效处理图像分割问题,比AP算法收敛更快分割效果更好最后,将MSAP算法应用于图像聚类中,给出了颜色空间非均匀量化后的分块加权的颜色直方图特征的提取方法,在此基础上,提出了一个利用MSAP算法对图像聚类的算法,该算法首先采用MSAP算法进行初步聚类,再得到的若干优秀代表中随机抽取个作为K-means的初始聚类中心,进行二次聚类,既大大降低了K-means随机初始中心对结果的影响,又解决了聚类数目不准确的问题实验结果表明,所提算法收敛更快,聚类效果更优