论文部分内容阅读
随着信息技术的发展,聚类技术在数据挖掘、信息检索、图像分割、模式识别等许多领域都得到了广泛的应用,其中无监督分类法更是一个充满挑战的研究方向。
本文提出了一种基于分水岭变换的聚类算法,这种方法把著名的分水岭算法融入到聚类技术中,它的基本思想是:在数据空间中建立一个个合适的网格,根据数据的分布情况在网格上定义密度函数,然后把每个网格的密度当作其灰度值,从而把数据空间转换成了数字灰度图像,再对其进行分水岭算法处理得到聚类结果。作者对随机产生的态分布的多个样本集的综合情况进行了实验,聚类结果表明该算法能够自动获得聚类的个数,而且正确识别率稍低于K-Means算法;对于K-Means算法无法解决的同中心的多个样本集聚类问题,本文提出的方法也收到了较好的效果。
这种方法最大的特点就是能够自动地得到聚类的数目,而无需用户指定,实现了一种完全无监督聚类方法。本文通过进行两组实验,得到了比较满意的结果,从而证明了该算法的可用性。