论文部分内容阅读
随着互联网的日益普及,电子商务已经成为人们生活中不可或缺的组成部分。大量的互联网用户与产品涌入到形形色色的电子商务网站中去,这就使得推荐系统得到了得天独厚的发展空间。随着系统规模的不断扩大,如何快速、有效地对不同的用户给出个性化的建议,已成为每一个推荐系统的首要目标。在电子商务中,协同过滤推荐技术是应用最为广泛的技术之一,然而现有的大多数协同过滤算法都存在着“冷启动”、“数据稀疏性”等问题。与此同时,目前大多数推荐系统往往忽略了用户自身的一些特性,如性别、年龄、职业等,这会严重影响推荐系统的推荐质量。综上,如何在数据稀疏的情况下,通过用户的属性值与改进的奇异值分解算法来提高推荐系统的推荐质量成为本文主要的研究问题。本文主要以推荐系统中的冷启动、数据稀疏问题为主要研究对象。在深入分析各种常见推荐算法的基础上,提出了一种利用用户属性值的聚类方法与图像处理中常见的奇异值分解(SVD)算法相结合的混合推荐算法。该算法在数据稀疏的情况下,可以有效的提高推荐系统的预测准确率。本文的主要研究成果如下:(1)深入分析推荐系统中的关键技术,着重分析协同过滤推荐算法的优缺点,指出了使用混合推荐算法的重要性。(2)介绍了常用的聚类方法,并且分析推荐系统中用户属性特征的重要性。提出一种全新的计算用户特征值的方法,通过该方法计算出每个用户的特征值,然后利用K-means聚类方法将系统中的用户进行聚类。(3)对奇异值分解的有关概念以及应用进行研究,分析了传统奇异值分解算法的不足。并且对原有的奇异值分解算法进行改进,结合用户特征值聚类,对稀疏矩阵进行填充。(4)利用本文提出的算法,实现了一个推荐系统的引擎,并且为指定用户做出推荐,通过该引擎描述本文提出算法的执行过程。利用实现的推荐系统申请了专利《基于奇异值分解算法的聚类协同过滤推荐系统》。(5)利用已有数据集设计多个实验分别验证各个推荐算法的推荐质量,最后比较本文提出的算法与一些传统的推荐算法之间的推荐质量,分析测试结果,证明了本文提出算法可以有效改进推荐质量。