论文部分内容阅读
层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义。针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法。文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法。采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性。对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能。