论文部分内容阅读
                            
                            
                                随着互联网的快速发展,越来越多的网民习惯性地从网络中获取需要的数据来解决生活中的众多问题,但是网络上混杂的海量数据给人们筛选出自己想要的数据造成了巨大的困难。为了解决这一矛盾,个性化推荐技术应运而生。推荐算法作为个性化推荐系统的核心一直是被关注和研究的重点。在众多的推荐算法中,应用最为广泛的就是协同过滤算法。传统的协同过滤算法使用网民对项目评分作为算法的输入,忽略了用户行为(比如购买、收藏、转发、项目点击次数)对于项目评分的影响,进而造成项目评分不够准确、用户-项目评分矩阵过于稀疏,最终导致推荐效果精准度较低。为了提高个性化推荐技术的效率,本文提出了一种基于用户行为的聚类推荐算法,并且在该算法的基础上,实现了一个基于B/S架构的个性化电影推荐系统。该算法从两个方面进行了改进:一是综合考虑用户行为信息和项目类别偏好信息。首先通过实现豆瓣电影为开发人员提供的第三方接口获取到用户的web日志,进而提取到用户的行为信息。根据经验对不同的用户行为赋予不同的线性权重,将用户行为转换成对项目的评分用以填充稀疏的用户-项目评分矩阵。填充后的用户-项目评分矩阵在数据稀疏性上较之前有了一定程度的下降。其次根据填充后的用户-项目评分矩阵按照项目类别进行k-means聚类,产生多个聚类簇。计算目标用户与聚类簇的距离,将目标用户归入距离最近的簇类中。最后在目标用户所属类簇中,使用传统的基于用户的协同过滤算法为目标用户生成个性化推荐列表。二是考虑到传统得余弦相似度计算对于距离不敏感的问题,本文提出了一种融合评分差异度权重的计算方法。在计算目标用户所属聚类的最近邻时,提高了最近邻计算的准确性,最终提高了推荐的精确度。本文采用了豆瓣电影系统为第三方开发人员提供的接口获取相关的用户行为数据,采用了综合F1综合指标和准确率来衡量推荐算法的质量,通过对比传统的基于用户的协同过滤算法(CF),基于用户聚类的推荐算法(UCCF),证明本文提出的基于用户行为的聚类推荐算法(ABUCCF)的有效性。