论文部分内容阅读
在传统的K-means聚类算法基础上,本文提出一种基于熵和均方差法综合赋权的Syn-K-means算法。引入综合权重提高聚类结果的类内相似度,从而提高聚类精度。算法中特征权重的计算基于概率论中数字特征的基本描述方法——均方差和信息论中信息特征的基本度量方法——熵;综合赋权系数的选择采用主观设定法求解。实验结果表明,Syn-K-means算法在聚类精度方面优于标准的K-means算法。