论文部分内容阅读
由于传统的BIRCH算法是用直径来控制聚类的边界,因此如果簇不是球形,它就不能很好地工作,而且传统的BIRCH算法只适用于单表。针对BIRCH的这些缺点,本文提出了一种改进的BIRCH—IBIRCH算法,该算法首先通过ID传播把多个表联系起来,使得BIRCH算法可以适用于多表的情况,再通过计算共享最近邻密度,可以发现任意形状的簇。实验表明,该算法不仅具有较强的可伸缩性,还可以得到较高精确的聚类结果。