论文部分内容阅读
随着互联网的普及和电子商务的蓬勃发展,大量的数据资源充斥在网络之中,人们不得不花费较长的时间选择自己喜欢的资源。个性化推荐系统的出现较好地解决了这一问题,成为当今越来越受关注的研究领域。目前,一些新的推荐方法和推荐技术相继出现。比较常用的推荐算法有基于关联规则的推荐算法、基于内容的推荐算法、协同过滤推荐算法以及混合推荐算法。 协同过滤推荐技术是个性化推荐系统中应用最广泛且最成熟的推荐技术。它通过分析用户的历史行为数据找出目标用户(或项目)的最近邻居集,进而参考邻居集合的喜好来预测目标用户的喜好,实现推荐。但其仍存在许多问题需要解决,主要有数据稀疏性、冷启动和算法扩展性差的问题。此外,还有新用户以及情景缺失等问题。 对此,本文提出一种基于用户情景模糊聚类的协同推荐算法。该算法综合考虑了用户评分信息和用户情景信息这两个因素对推荐的影响,主要工作有三点。 第一点,将聚类技术应用于协同过滤推荐系统中,提出了一种基于用户情景模糊聚类的协同过滤推荐技术。第二点,提出了一种传统的协同过滤中用户相似性度量的改进算法。第三点,提出根据用户间的综合相似性寻找目标用户的最近邻居。对于第一点,首先根据用户情景信息利用模糊聚类算法对用户进行聚类,将情景信息相似的用户放入同一个聚类中。下一步的协同过滤是在具有相似情景的用户群中进行的,具有相似属性的人更容易产生相似的兴趣爱好;同时,最近邻居是在目标用户所属的小的聚类中生成的,降低了计算所需的矩阵的维数,提高了算法的可扩展性。对于第二点,在计算用户相似度时,先利用Slope One算法对稀疏矩阵中的评分缺失项目进行预测填充,再在新矩阵上进行计算,有效改善了数据稀疏性问题,提高了邻居用户选取的准确性。对于第三点,综合考虑了用户情景信息及用户评分信息对推荐的影响,将用户主观评分相似性与用户客观情景信息相似性以一定的权重结合起来得到用户间的综合相似性,使得没有进行过任何评价的新用户也能得到推荐。 本文在MovieLens数据集上采用平均绝对偏差(MAE)和平均相对偏差绝对值(MAPE)两种度量标准验证了本文提出的算法。实验结果表明,本文算法较传统的协同过滤推荐算法以及个性化服务中基于模糊聚类的协同过滤推荐算法在推荐精度上有一定的提高。最后,通过一个实际的项目说明本文算法在实际中的应用。