论文部分内容阅读
随着web2.0的出现,社交网络服务发展迅速,成为人们参与信息发布、传播的主要媒介。社交网络用户和信息的爆发式增长,使得人们面临信息过载的问题。社会化推荐作为一种信息获取的方法应运面生。社交网络中存在很多异构信息源,例如,社交关系信息和语义信息,这为缓解传统协同过滤算法面临的数据稀疏和冷启动问题带来了机遇。同时,如何有效利用多种信息源也成为社会化推荐的一大挑战。 针对以上问题,本文提出两种新颖的社交网络推荐算法。一种是基于协同关系深度学习模型(Collaborative Social Deep Learning,CSDL)的推荐算法。该模型是一种分层贝叶斯混合模型,它有机融合了用户历史行为记录信息、项目的文本语义信息、项目的社会关系信息和用户的关系信息。具体地说,通过引入Jaccard相关系数计算用户相似度值处理普通用户的社交关系,获得的相似度值用来约束用户和其他用户之间的偏好。使用深度学习技术从稀疏的项目内容信息中提取特征,矩阵分解项目的社交关系和用户历史行为记录。另一种是基于社会化协同深度学习模型(Social Collaborative Deep Learning,socialCDL)的推荐算法。该模型把用户历史行为记录信息、项目的文本语义信息和项目的社会关系信息有机组合在一起,形成一个高效统一的模型。具体地说,模型首先分析项目的社交关系,为矩阵分解项目社交关系提供物理解释。接着运用矩阵分解方法分解关系矩阵和用户历史行为,得到关注者模型和被关注者模型。然后对传统的级联去噪编码器(Stacked Denoising Autoencoder,SDAE)模型做出改进,应用关系正则化的SDAE模型(social factor regularized Stacked Denoising Autoencoder,sfSDAE)提取项目语义信息特征。 本文提出的两种模型充分发挥多种异构信息源的优势,使各种信息之间相互影响、相互学习、相互补充,有效缓解了传统协同过滤中的冷启动和稀疏问题。根据Recall与AP这两种评估标准,本文提出的两种推荐算法在两个实际数据集上推荐效果与其它三种先进的推荐算法相比都有所提高。