论文部分内容阅读
进入21世纪,互联网技术快速崛起,特别是基于手机客户端的移动互联网的普及让人们能够更方便快捷地获取到网络上的各种信息,这也宣告了信息过载时代的来临。信息过载,使得网络上的信息生产者和消费者都受到了极大地挑战,信息消费者无法快速地找到自己感兴趣的信息,而信息生产者渴望自己生产的信息受到用户的青睐。个性化推荐系统的发展为这一矛盾的解决带来了曙光,对于信息消费者而言,推荐系统能够分析用户的历史行为信息,从而预测用户的兴趣偏好并进行主动地推荐。对于信息生产者而言,推荐系统能够分析信息的内容和特征从而精准的推荐到需要的用户面前。虽然,推荐系统能够很好的解决信息过载的问题,但随着互联网的发展以及应用的深化依然存在诸多的问题与挑战需要后来者去解决与完善。本文阐述了课题的研究背景及意义,总结了推荐系统目前的国内外现状,分析了个性化推荐算法的原理和优缺点。针对传统基于用户的协同过滤算法(collaborative filtering)在海量数据情况下存在推荐精度不高、多样性和新颖性不足等缺点,提出了一种基于用户模糊聚类并融合人口统计属性相似度改进的协同过滤算法。该算法在保证推荐准确度的基础上有效地提高了系统推荐列表的多样性和新颖性,更好地满足了用户的个性化需求和良好的用户体验。具体来说,本文的主要工作如下:(1)总结归纳了当前推荐系统应用的相关理论和技术,详细介绍了个性化推荐系统相关的数据集、实验方法和评价指标。深入分析了传统推荐方法的原理以及在推荐多样性上存在的缺点,针对性地提出了相应的优化方法;(2)针对传统基于用户的协同过滤方法推荐多样性和新颖性不足的缺点,本文提出了一种改进的算法。该算法首先根据用户的多兴趣特征对用户进行模糊聚类,根据归属程度的不同将用户聚类到多个簇中,在协同过滤阶段算法降低了活跃用户和热门项目在用户相似度计算时的权重,避免了推荐系统的马太效应,有效地提高了推荐的多样性;(3)本文根据算法的特点,在MoviLens数据集上进行了一系列实验,实验结果验证了本文算法的可行性和有效性,最后根据上述算法设计并实现了一个小型的推荐系统。