论文部分内容阅读
随着人工智能技术的发展,人们获取信息的方式越来越多,也越来越便捷。与此同时产生的信息量也在呈几何倍数增加,“信息超载”问题随之而来,人们的个性化需求很难得到满足。个性化推荐系统是解决“信息超载”最有效的方法,而且已经被应用到相关领域。协同过滤推荐算法由于其简单易于实现、跨领域等优点,已成为个性化推荐系统中应用最成功的推荐技术之一。传统协同过滤算法根据用户和项目之间的关系为用户推荐其感兴趣的项目,然而由于数据稀疏性问题、多样性问题等严重影响推荐的准确度。针对个性化推荐算法存在的上述问题,本文重点研究传统协同过滤算法面临的数据稀疏性问题、多样性问题,将用户和项目属性信息融入到相似度计算中,为了提高推荐的准确性,对传统协同过滤算法进行改进,同时提出混合协同过滤个性化推荐算法,主要工作包括:第一,考虑传统协同过滤算法在计算相似度时因数据稀疏问题导致计算精度不够高,在计算相似度时融入用户特征和项目特征信息,准确地计算出用户间和项目间最近邻集合,较好地解决因数据稀疏引起的推荐精度不够高的问题。第二,将改进的传统协同过滤算法、矩阵因子分解算法、带偏置的矩阵分解算法与线性回归模型、XGBoost模型进行融合,提出一种混合协同过滤个性化推荐算法,将用户对项目的预测评分作为线性回归模型、XGBoost模型的输入,根据训练好的模型预测未知评分,将两个模型的预测评分进行组合,采用Top-N算法产生推荐列表。第三,在公开的MovieLens数据集上,对改进的协同过滤算法和混合协同过滤个性化推荐算法进行实验验证。相比其他比对算法,本文提出的混合协同过滤个性化推荐算法最优,其次是改进的协同过滤算法,他们都在准确率上优于传统协同过滤算法,一定程度上提高了推荐的质量。