论文部分内容阅读
本文将位置敏感哈希算法(LSH)应用于图聚类,提出了概率化的图聚类法(PGC)。利用LSH技术比较图中各结点邻居集的相似度,并结合贝叶斯统计推断进行验证,在线性时间内找到图中最紧密的、非精确聚类。测试结果表明,随着图尺寸的增大PGC扩展性更强,在现实世界数据集上PGC比PageRank Cluster聚类速度快约1倍,是一种有效的解决方案。