论文部分内容阅读
随着Intemet和电子商务的迅猛发展,聚类技术在Web用户划分方面的作用越来越明显。Web用户聚类的难度在于有成千上万的用户需要聚类,而且每个用户的偏好向量是高维稀疏的。对于处理大规模的数据集。近邻传播算法是一种快速、有效的聚类方法。但面对高维稀疏的数据,近邻传播算法往往不能得到很好的聚类结果,而且该方法不能产生指定类数的聚类。本文提出一种改进的近邻传播算法,使用该方法对Web用户进行聚类。根据灰关系等级和Jaccard系数定义用户相似度矩阵,对算法产生的初始聚类进行重新分配,获得指定类数的聚类。实验结