论文部分内容阅读
K-means++算法在K-means基础上提出了对距离通过概率选择的方法获得下一个初始聚类中心,针对过程中迭代次数和时间消耗,本文提出了一种高斯混合分布下基于最大期望算法估算初始样本中心的算法(EMK-means++)。算法定义适当瞭望样本并获取瞭望样本下的整体样本距离,利用最大期望一次估算全部初始聚类中心位置,在后续迭代求解过程中有效减少迭代次数,降低时间开销,提高了整体聚类效果。