论文部分内容阅读
K-means算法是一种应用非常广泛的聚类算法,它有很多优点,比如操作简单、效率很高、伸缩性较好,但也存在一些不足,比如聚类个数需要人工输入、初始聚类中心随机产生可能导致局部最优解、孤立点对聚类结果会产生较大影响等。笔者主要针对K-means算法的K值获取和初始聚类中心的选取对算法进行改进,并通过实验对比了原算法和改进算法,实验表明改进算法在聚类准确率和质量方面都优于原算法。