论文部分内容阅读
介绍了在聚类中广泛应用的经典κ-均值算法,针对其随机选择初始质心和易受孤立点的影响的不足,给出了一种改进的κ-均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始质心的选择上进行了改进,并做了改进前后的对比试验。试验结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择质心的影响也有所降低。