论文部分内容阅读
<正>聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。聚类主要有层次聚类和非层次聚类两种方法。前者包括合并法、分解法、树状图;而后者主要包括划分聚类、谱聚类。下面重点介绍一下非层次聚类算法中的K-means算法。其执行过程包括初始化和循环:初始化是指选择(或人为指定)某些记录作为凝聚点;而循环步骤主要有:(1)按就近原则将