论文部分内容阅读
随着推荐系统的持续发展和应用,用户数和项目数骤增,导致现有的推荐系统受到冷启动问题、稀疏性问题和可扩展性问题的阻挠。本文从协同过滤推荐算法出发,深入探讨了协同过滤推荐算法中运用的各种技术,分析了各种协同过滤推荐算法的特点,从不同角度给出了上述问题的解决思路。为提高推荐算法的推荐效果,提出两种改进的相似度计算公式EuclideanRPR相似度与Co-Occurrence-RPR相似度。EuclideanRPR相似度提高了推荐结果的精度,Co-Occurrence-RPR相似度提高了推荐结果的准确率和召回率。在MovieLens经典数据集上验证了改进相似度的有效性。为解决共同评分数据偏少导致的相似度计算公式可信度下降的问题,提出一种融合物品标签信息的混合推荐算法ItemCF-T,该算法能够根据项目间共同评分项目的数量信息,自适应选取合适的相似度计算公式,从而使推荐精度有所提高,在Movie Lens数据集上验证了该算法的有效性。为解决推荐系统中常见的数据稀疏和扩展性问题,研究了四种基于SVD的推荐算法,分别是SVD-ALS、SVD-SGD、Biased-SVD及SVD++算法,并比较了各个基于SVD推荐算法的特点,最终通过在Movie Lens数据集上的实验验证了基于SVD的协同过滤推荐算法的优势与前景。最后,实现了一个基于C/S模式的电影推荐系统,并运用上述改进的Co-Occurrence-RPR相似度的ItemCF算法对推荐引擎进行实现并优化,使用Jetty容器和Jersey框架设计服务器,使用Python Scrapy框架设计网络爬虫,使用SQLite数据库格式化存储数据,通过Android客户端的UI显示可以直观方便地看到推荐算法的推荐效果。