论文部分内容阅读
随着网络技术和设备的提高,网络用户已不仅仅是信息的获取者,还是信息的发布者。网络上的信息资源越来越多,要从大量的信息中获取有用的信息变得越来越难。推荐系统能为网络用户提供最相关的和感兴趣的信息,从而满足网络用户的需求。在推荐系统中,使用最广泛的算法是协同过滤推荐算法,特别是在电子商务领域中,协同过滤推荐算法获得了很大的成功。由于协同过滤推荐算法是利用其它用户的信息来进行推荐的,它能为用户推荐任何类型的内容,所以相较于基于内容的推荐算法,协同过滤推荐算法具有更大的优势。协同过滤推荐算法主要是利用用户在网站上留下的评分信息为用户提供个性化的推荐。由于用户和项目的数量非常大,而用户对项目的评分数量十分有限,使得协同过滤推荐算法面临着数据稀疏性的问题。数据稀疏性问题是造成传统协同过滤推荐算法评分预测准确度和推荐质量不高的一个主要原因。本文主要研究了面向数据稀疏性的协同过滤推荐算法,提出基于用户隐性背景信息和非邻居用户的协同过滤推荐算法。本文首先提出了用户隐性背景信息的概念,将用户隐性背景信息引入到协同过滤推荐算法中,利用用户-项目评分矩阵和用户背景信息,得出项目属性值,根据项目属性值和项目类别,计算得到每个项目类别下的用户隐性背景信息;再将用户隐性背景信息与多属性决策方法进行结合,对项目进行过滤,对初始评分矩阵进行降维,形成初始项目集;接着在初始项目集中,用传统相似度算法进行相似度计算,选出目标用户的邻居用户,余下的作为目标用户的非邻居用户,对于邻居用户用传统的协同过滤推荐算法预测评分,对于非邻居用户,用概率来表示与目标用户的评分模式关系,预测出项目的评分;然后分别赋予邻居用户预测评分和非邻居用户预测评分的权重,将这两种预测评分结合起来,得到最终的项目预测评分及推荐项目集,为目标用户提供推荐。本文提出的方法用MovieLens数据库中的数据进行了实验和评估,实验证明相较于传统的协同过滤推荐算法,本文提出的方法在数据稀疏性、项目评分预测准确性和项目分类准确性这三个方面有更好的表现。在文章的最后,本文总结了研究工作内容,分析了研究的不足之处,并对未来的研究方法进行了展望。