论文部分内容阅读
随着社会信息化水平的提高,信息过载的问题日益突出。推荐系统能节省用户时间,提高信息的利用率。它通过考察各用户、物品和信息本身的特征及其历史记录信息,形成对用户偏好和物品特征的判断,进而推荐符合用户偏好的物品或信息给相应的用户。本论文聚焦于推荐系统里的评分预测问题,引入网络表示学习并使用了用户对物品的评分数据、用户间信任网络数据和物品类别数据,构建了解决评分预测问题的框架TrustEmbed及其拓展版本。主要包括以下工作和结论:(1)在TrustEmbed中,将用户间的信任网络数据与用户对物品的评分数据融合成一个自主设计的“物品关系网络”,再利用网络表示学习方法得到每个物品对应的低维向量表示,进而通过计算物品间的相似性来预测用户对物品的未知评分。(2)改进了TrustEmbed中所引用的网络表示学习方法node2vec,在原有的随机游走过程中增加了节点“热度”的影响,使得改进后的算法能够采集到更高阶的全局网络拓扑信息。(3)对数据集结构进行了多角度的分析。评估了各个算法的评分预测误差。讨论了参数的不同取值对算法效果的影响。使用t-SNE算法对TrustEmbed得到的物品向量进行可视化分析,佐证了TrustEmbed能够挖掘出物品的潜在特征,为评分预测任务提供有效的帮助。(4)探究了数据集的稀疏程度对各算法的影响以及在信任数据缺失情况下各算法的效果变化,结果表明TrustEmbed具有更好的鲁棒性。尝试在TrustEmbed上使用其它的网络表示学习方法,并讨论了TrustEmbed的灵活性和合理性。(5)提出了两个TrustEmbed的拓展版本,将物品类别数据也融合进物品关系网络的构建中,体现了TrustEmbed具有较强的可扩展性。