论文部分内容阅读
随着智能设备应用的普及,各类数据信息呈爆炸式地增长,推荐系统成了解决信息过载的重要方法。现今推荐系统已在电子商务、大数据和机器学习等领域广泛应用,如何获取用户的兴趣特征、模仿用户的行为模式一直是其研究重点。推荐系统发展至今,主要分为三大类:基于内容的推荐、协同过滤和混合推荐。基于内容的推荐能准确学习到用户特征,解释性强,却面临冷启动问题和推荐项目新颖性的问题;协同过滤虽然可以有效利用其它用户或项目的信息进行推荐,缓解新颖性问题,可是却面临着稀疏问题和可拓展问题的挑战;混合系统则是利用各算法的优势进行组合以提高整个混合推荐系统的性能。本文针对数据稀疏问题和鲜有算法考虑用户本体特征的问题,提出一直多准则模糊K邻近推荐算法;以及针对用户兴趣动态变化的问题,提出一种基于深层双向长短期记忆(LSTM)网络的推荐算法。最后将两种推荐算法进行结合,利用各自优势互补来减少浅层模型学习能力不足和冷启动问题带来的影响。本文主要工作如下:1)针对数据稀疏度和未考虑用户本体特征,提出了多准则模糊K邻近算法。使用模糊数学处理用户评分矩阵并采用模糊相似度度量公式,以降低用户评分模糊性所带来的影响。再引入个人信息相似性和用户-用户的Jaccard系数,以完善用户之间的综合相似度度量公式。使用K邻近算法,给出拟推荐项目列表。相对于其他K邻近算法,RMSE和MAE都降低了约1%-4%,F值提高了约1%-4.5%;2)针对传统协同过滤无法学习用户特征,更无法有效利用时间因素解决用户兴趣动态变化的问题,提出一种基于深层双向长短期记忆(LSTM)网络的推荐算法。在算法中引入循环神经网络,采用深层双向长短期记忆(LSTM)网络,从前后两个时间顺序上学习用户历史评分行为和兴趣周期特征,并利用深层网络进行叠加学习,构建更加贴合用户评分习惯的评分预测模型。同时加入dropout策略来解决过拟合问题,以提高预测精度。相对于现有的其他神经网络模型,各项误差降低2%-5%,r2提高了5%-10%;3)将多准则模糊K邻近算法和深度双向长短期记忆(LSTM)网络模型进行结合,使用后者解决前者因浅层模型导致的学习能力不足问题,同时使用前者解决后者的冷启动问题。利用多准则模糊K邻近算法获取拟推荐项目列表,缩小推荐搜索空间,再通过深度双向长短期记忆(LSTM)网络对拟推荐项目进行预测评分,获得最终TopN推荐列表。最后从K邻近改进算法、浅层模型推荐算法和深层模型推荐算法三个角度进行对比实验。实验证明本文提出的个性化推荐算法相较于其他各类协同过滤算法,RMSE降低了约2%-5%、MAE降低了约2%-5%,和F值提高了约2%-3.5%。