论文部分内容阅读
随着互联网应用的发展,推荐系统也越来越受到大家的关注,并且在工业界以及学术界都取得了巨大的成功。传统单一维度的推荐系统已经不能满足用户个性化的需求,而上下文相关的推荐系统不仅能够较好的帮助用户走出信息过载的困境,而且能够更加充分的挖掘用户的潜在需求。然而在基于上下文推荐系统的设计中对用户情感状态的获取存在很大的难度,而且各项数据都很难与用户情感状态关联起来,因此在实现中很少将用户的情感维度加入到推荐系统算法的设计中。但是在很多场景下,用户的情感状态往往会很大的影响到到用户接下来的行为,例如听歌,看书等等。 针对获取用户情感状态比较难的问题,本文采用基于文本分析的方法通过获取用户在新浪微博发布的微博数据,将用户微博转化为情感序列,再通过特征挖掘算法提取序列特征,然后在提取的序列特征的基础上构建了基于监督学习的训练数据集,最终实现了基于SVM的分类器。 针对用户情感状态与用户听歌数据之间互相隔离的问题,本文通过利用虾米音乐网上丰富的用户标签数据,设计了基于用户标签的歌曲特征提取与分类方法,通过分析用户历史微博数据来获取用户的历史情感状态,再与用户历史歌曲分享记录相结合,基于一定的时间窗口建立了用户情感与歌曲特征关联数据库。 本文以协同过滤算法为基础,设计了基于用户情感与歌曲特征的用户相似度计算模型和用户对特定歌曲类别的兴趣度计算模型。另外本文还基于图模型,给出了以路径融合算法为基础的推荐算法,以及相应的用户相似度计算方法。 为了验证上述方法的可行性,本文不仅设计了基于数据集的离线实验,还实现了基于微博的在线验证系统,通过收集用户的反馈数据来分析推荐效果。实验表明,本文提出的方法比传统的推荐方法有更好的推荐效果,为多维度多层次的推荐系统设计加入用户情感上下文提供了可行的方案。