论文部分内容阅读
随着网络的普及和信息技术的日新月异,电子商务这种新兴的商务活动方式被越来越多的企业和个人接受。为了满足用户的各种需求,电子商务系统的商品信息量迅速膨胀。用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。电子商务推荐系统就是在这样的情况下应运而生。推荐系统在电子商务平台上扮演销售人员的角色,向用户推荐商品,帮助用户找到所需商品,从而顺利完成购买过程。电子商务推荐系统在应用中具有良好的发展和应用前景,逐渐成为一个重要研究内容,得到了越来越多的关注。协同过滤技术是目前推荐系统中应用最早和最为成功的技术之一,它的基本思想是:用户是可以按照兴趣分类的,具有相似兴趣的用户会购买相同的商品。尽管协同过滤技术在电子商务推荐系统中的应用获得了较大的成功,但是随着商务网站结构的复杂化,商品信息量和用户量的与曰俱增,协同过滤推荐系统的发展面临着两个主要挑战:1)提高协同过滤算法的可扩展性,协同过滤算法能够为几千名用户提供较好的推荐,但是,当信息量膨胀到一定程度,算法的性能就开始急剧下降了。2)降低推荐系统数据集的稀疏性,协同过滤是基于其他用户的信息来产生推荐的,大多数用户感兴趣的商品信息不超过总量的1%,使得推荐系统不能准确地找到相似用户和识别推荐项目,导致了贫穷的推荐。针对这些问题本文提出一个改进的协同过滤方法——基于协同过滤和聚类的组合推荐算法。在这个方法中,首先使用聚类算法对所有的项(商品)进行分类,得到k个相似项集合。对用户的推荐计算就限定在他感兴趣的相似项集合里,有效地解决了算法的可扩展性问题,又符合多数用户只对某几类商品感兴趣的特征。接着,使用协同过滤技术产生推荐。在协同过滤模块我们又分两步进行:第一步,使用基于项目的协同过滤算法,根据邻居项计算预测评分,并把值较高的一些评分填充到用户一项矩阵内,得到一个新的比较稠密的矩阵,缓解稀疏性问题;第二步,选择用户感兴趣的相似项集合,在每个集合内,使用基于用户的协调过滤算法预测用户兴趣,产生推荐,最后综合这些推荐。这样既能免除邻居的多个兴趣的干扰,又兼顾了目标用户的各个不同兴趣。