论文部分内容阅读
在电子商务大行其道的时代,人们需要的不再是简单的信息提供,而是有针对性的信息推荐。众多个性化推荐技术中协同过滤可谓一枝独秀,该算法引领了当今各大电子商务平台的推荐系统的发展趋势。但随着电子商务行业规模不断发展壮大,无论是用户还是商品的数量呈现指数级增长,同时用户对电子商务推荐所提供服务的要求也越来越高。协同过滤技术在面对当前的挑战时暴露出许多有待解决的瓶颈问题。针对存在的这些问题,国内外的研究机构和学者不断地探索改进方案。本文深入分析比较了协同过滤算法及当前主要的改进算法。提出基于模范用户的协同过滤算法。模范用户的概念类似于现实生活中的劳动模范或标兵。在某个领域或行业起到模范带头作用,也是其他人效仿和学习的榜样。将这样一个概念引入到协同过滤推荐算法中,主要目的是希望建立一个有较好稳定性的模范用户模型,该模型中的用户能反映其所在的一个或多个领域内用户的兴趣爱好,协同模范用户推荐出的商品应该是准确和可信赖的。该模型的建立对于缓解协同过滤技术中存在的稀疏性问题、推荐的实时性问题有很大的帮助。同时稳定的模范用户模型也可以应对电子商务平台快速增长的用户和商品数量的挑战。本文通过对用户-项目评价矩阵中的用户聚类,在每个类中生成一个模范用户评分向量。模范用户并不是聚类的中心,而是按照一定的生成规则生成的虚拟用户。该组用户增大了类内用户的评分密度,反映了类内用户整体评价趋势。聚类技术通常必须指定一个聚类个数,这样给出的聚类结果是否合理,是否真正反映了用户群的分类就需要进行聚类有效性的验证。本文通过DB指标对普通C均值聚类算法的聚类效果进行验证,当DB指标取到极小值时聚类迭代结束,获得最优聚类粒度;通过分割系数PC对模糊C均值聚类进行有效性验证,当聚类自适应函数值取到极大值时获得最优聚类粒度。对于两种聚类算法均实现了自适应聚类粒度的确定。实验表明:聚类数自适应算法可以取得有效性验证指标的局部最优值,既最优聚类效果。对在此基础上生成的模范用户模型应用协同过滤推荐算法,目标用户在线推荐的效率有很大的提高,模范用户模型相对稳定,推荐精度也有所改善。