论文部分内容阅读
随着近些年来互联网的飞速发展,互联网上的信息越来越多,已经远超过个人能够接受、处理或利用的有效范围,这也就是经常被提到的互联网信息过载问题。推荐系统一直是解决信息过载的重要技术,许多关于推荐系统的算法也不断的被提出,其中很多算法已经在互联网个性化服务、电子商务、计算广告等方面取得了不错的效果。虽然各种各样的算法被提出,但推荐系统依然面临着一些难题,像难以处理大规模数据的问题、预测准确性不高的问题、数据稀疏的问题以及冷启动的问题等等。在另一方面,随着过去几年中互联网社交网络的出现,越来越多的用户社交网络信息可以利用。在有的互联网社交网络上,利用用户的社交网络信息,一些推荐策略获得了显著的效果,然而,这些信息在当前的推荐系统上并未利用好。本文首先介绍了推荐系统的研究现状,分析和总结了当前已有的一些协同过滤推荐算法的优点和不足。同时,本文还介绍了社交网络分析中节点相似度计算的一些方法,分析和总结了它们的原理和应用场景。在相关成果的基础之上,针对当前协同过滤技术在互联网社交网络上面临的问题,深入研究了将社交网络分析和协同过滤技术结合起来的方法,并给出了一些有效的解决方案。本文的工作内容包括如下三个方面:(1)针对用户在社交网络上的社交关系信息,本文中先进行社交网络的建模,然后提出一种利用机器学习的方式进行社交网络上节点相似度计算的方法。该方法利用节点自身的信息、传统的节点相似度计算方法计算出的结果、一些的辅助信息等作为机器学习的训练特征,以节点对之间是否存在边作为标注信息,然后利用Logistic回归模型作为训练模型计算节点的相似度。在计算出节点相似度后,本文还提出一种根据节点相似度信息和用户评分信息预测用户评分的算法,本文中统一称这种算法预测出的用户评分为用户信任评分。(2)针对传统的协同过滤推荐算法在大规模用户的推荐系统中面临的如时间空间开销过大、无法给新用户进行推荐等问题,本文提出了一种改进的协同过滤推荐算法,该算法先构建“用户特征-项目”的评分矩阵,然后利用潜语义模型求解矩阵,最后根据求解后的矩阵和用户的特征信息,采用线性加权的方式预测用户对项目的评分,本文中统一称这种算法预测出的用户评分为用户偏好评分。(3)在计算出用户的信任评分和用户偏好评分后,需要有一种好的方法将两者进行融合以形成最终的用户对项目的评分。本文提出了一种利用机器学习融合用户信任评分和用户偏好评分的算法,该算法利用用户信任评分、用户偏好评分、用户社交网络上邻居数量、用户的特征数量等作为训练特征,以用户实际的评分为标注信息,然后利用Fisher线性判别为训练模型预测用户对项目的评分,该算法预测出的评分即为最终的用户对项目的评分。