论文部分内容阅读
随着Web2.0技术的迅速普及,Internet上的数据和资源都处于指数增长阶段,这就会使用户面临信息过载的问题。推荐系统是解决这个问题的有效办法之一,其中协作过滤利用用户评分矩阵,计算用户之间相似度,并根据邻近用户喜好向目标用户进行推荐。但是协作过滤存在新用户冷启动、数据稀疏性、可拓展性等问题。本文针对这些问题,利用混合推荐算法的优点,对协作过滤算法进行了相应的改进,主要工作如下:(1)梳理归纳了推荐系统的相关算法,阐述了国内外学者对协作过滤算法的研究现状。针对协作过滤算法存在的缺点进行深入分析,并探讨如何利用现有技术来提升协作过滤推荐算法的性能。(2)针对冷启动和推荐精度问题,提出了综合用户特征及专家信任的协作过滤推荐算法。通过引入用户特征,利用用户填写的注册信息有效缓解推荐系统中冷启动问题。通过引入专家信任,能够比较用户与专家的相似性,从而计算用户-专家相似度矩阵,进而有效降低了数据集的稀疏性,提高预测的准确度。从实验结果可以看出,该算法能够有效缓解冷启动问题,明显提高了系统的推荐精度。(3)针对数据稀疏性和可拓展性问题,提出了基于奇异值分解与K-means++聚类的协作过滤推荐算法。通过将用户聚成多个簇,然后在与目标用户相似的簇中寻找邻居集,这样可以缓解数据的稀疏性,同时也降低了计算量。通过奇异值分解将用户-项目评分矩阵进行降维,并对稀疏矩阵进行填充,这些模型可在离线的状态下进行建立。从实验结果可以看出,该算法能够有效缓解稀疏性,并提高推荐精度。