论文部分内容阅读
信息技术与社会经济的提升使得网民规模大幅度增加,同时互联网的信息与内容呈现变得更加混乱,如何使网民在过量的信息中迅速并且有效的寻找有价值的内容,是我们急待解决的问题。在这种情况下,推荐系统应运而生。在多年的发展中,基于近邻的推荐算法因原理简单并且高效,一直被广泛应用在各种推荐系统中。而基于近邻的推荐算法也存在一些不足,如数据稀疏性问题,用户冷启动问题,用户兴趣漂移问题等,同时在相似度计算时,也存在可分辨性问题。针对这些问题,本文通过研究分析相关文献,发现灰色系统理论对处理信息不明确的系统有很好的优势。按照灰色系统理论的相关步骤,先对项目或用户进行灰色聚类,缩小项目空间,可以使系统的复杂程度降低,然后对同一聚类内的项目或用户进行灰色关联分析,可以使系统的计算量减少。本文通过引入该理论,提出一种改进的混合推荐方案。主要研究工作有以下三点:(1)在基于近邻的推荐算法中,相似度计算的方法是影响推荐的重要因素,本文通过分析传统的相似度计算方法,发现存在计算可分辨性问题,而灰色关联相似度是由一些离散的点取均值得到,使用灰色关联相似度代替传统的相似度可以有效缓解这种问题。同时,由于用户的兴趣会随时间改变,所以在相似度计算公式中加入时间衰减函数,改善时间效应对推荐的影响。本文通过调节参数将两种相似度计算方式结合,提出一种基于灰色关联分析的混合推荐算法,并给出了算法的设计架构和步骤。通过选择不同的参数进行实验,在分辨系数等于0.3、调节参数等于0.6、邻居数等于40时,本文算法的推荐精度比传统的协同过滤、基于时间效应的协同过滤、基于灰色关联的协同过滤分别提高10%、6%、3%。(2)针对数据稀疏性问题,本文利用灰色关联聚类可以将同类因素归并,简化系统的复杂性,以及对样本量和样本的规律性无特定要求这种优势,提出一种基于灰色关联聚类的混合推荐算法。在使用基于灰色关联分析的混合推荐算法之前,先对项目聚类,缩小项目空间,然后在同一聚类内计算相似度,寻找近邻,最后将灰色关联聚类算法与基于灰色关联分析的混合推荐算法结合,结合后的算法不仅具有处理稀疏性数据的能力,而且对(1)中提出的问题也有改善的效果。同时聚类可以在线下计算,能显著提升推荐的效率。经过实验的验证,在聚类邻居数等于50时,本文算法推荐精度最高,比其他算法提升约3%,并且在聚类邻居数超过50时,算法趋于稳定,体现了灰色关联聚类对处理稀疏性数据的优势。(3)使用MovieLens数据集,进行仿真实验。首先分析算法的参数,寻找最优的值,然后在最优参数的条件下,再次进行实验。最后将本文算法与其他算法对比分析,在分辨系数等于0.3、调节参数等于0.6、聚类临界值等于0.7、邻居数等于50时,本文算法比其他算法的推荐精度有小幅度提升,验证了本文算法的合理性和可行性。