论文部分内容阅读
聚类分析是数据挖掘领域的一个重要研究方向。本文对CURE层次聚类算法进行了深入的研究,并针对目前算法的不足进行了改进。新方法用多点表示一个类,舍弃了代表点收缩的过程。根据基于网格和密度聚类算法的原理对原始数据进行预处理,降低噪声影响、缩短聚类时间。实验表明,改进的CURE能正确识别大多数类,速度明显优于原算法。