论文部分内容阅读
对于大规模的图数据,当前的图聚类算法的时间和空间扩展性较差,且倾向于细粒度的簇.本文提出k层邻接点概念,从而避免单层邻接点导致的聚类细化.提出一种基于割集的分布式聚类算法,通过连通性判断搜索最小代价割集,从而降低图分片的关联性,提高算法的并行度和可扩展性.通过实际数据集上的大量实验表明,本文所提出的聚类方法较传统方法在时间和空间效率上具有较大优势,并且可以发现更高质量的簇.