论文部分内容阅读
由于基于密度峰值的聚类算法对簇的形状不敏感,其聚类结果表现出良好的抗噪性。然而,当密度定义中变量难以反映簇的结构时,该算法性能下降明显,其主要原因在于聚类的非监督性。为此,该文在此算法的基础上提出了一种基于密度峰值的半监督聚类算法。该算法通过增加must-link和cannot-link约束作为先验知识,并在must-link约束集中叠加数据点的密度,以此产生新的聚类中心从而实现对数据点的吸引;对于cannot-link约束集中的数据点,通过将其n级最近邻居分离的方式找到其所属聚类中心,实现簇的归属