论文部分内容阅读
由于互联网飞速发展、信息数量爆发式增长,人们难以从中筛选有价值的资源、获取自己所需信息导致的越来越严重的“信息过载”问题,推荐系统(Recommended System)已经成为了各种电子商务的重要手段,可以帮助用户从海量数据中快速高效地发现获取自己所需信息,提高用户体验,防止用户流失。而作为推荐系统的关键部分,推荐算法(Recommendation Algorithm)受到了很多领域的专家学者们的广泛关注。算法性能的优劣直接影响系统推荐结果的准确性。因此各位学者提出了许多性能优越的推荐算法,为用户提供更精确、更有效的推荐服务,在推荐系统领域内,协同过滤算法(Collaborative filtering algorithm,CF)是应用得最广泛的推荐算法,但是其依然存在着冷启动、算法可扩展性与数据稀疏性等许多问题。将数据挖掘中的聚类技术用到推荐系统中,先对用户或者项目进行聚类分析来改善这些问题。基于聚类的协同过滤推荐算法(Cluster-based Collaborative filtering algorithm)可以不同程度上解决数据稀疏性和算法扩展性的问题,其具有较高的推荐准确率、优越的算法性能。本文针对基于聚类的协同过滤推荐算法进行系统研究,根据对该算法的表现性能及其优缺点,对推荐过程提出优化和改进的方案。从而获得更优越、更准确的推荐结果。在原始基于聚类的推荐算法基础上,分析了聚类结果对推荐结果精度的影响之后,引入一种仿生群智能优化算法——布谷鸟搜索算法(Cuckoo Search,CS),利用该算法效率高、全局寻优能力强、收敛快的特点,来改进如果聚类算法初始聚类中心选取不好情况下可能导致的局部最优的问题。设计了一种K-means&Cuckoo Search优化推荐算法模型——基于布谷鸟搜索的聚类推荐算法。然后在聚类的时候设定选取参与评分数量比较多的用户为初始聚类中心,针对布谷鸟搜索算法存在后期收敛速度较慢的问题,本文对其进行了产生步长机制的自适应改进。最后,在Movielens数据集仿真实现了基于布谷鸟搜索的聚类推荐算法。通过与其他几种推荐算法的对比实验证明,该算法表现出了较好的结果,可以在一定程度上缓解数据稀疏性以及算法扩展性问题,推荐精度也得到了提高,同时也具有较好的推荐效率。