论文部分内容阅读
信息时代的到来,在给我们带来便利的同时,也为我们提供了更多的选择,在面对多种选择时,我们无法快速准确地选择所需信息,这就是信息过载问题.推荐系统在解决信息过载问题上取得良好的效果,能帮助用户更精确更快速地从大量信息中找到满意和合适的信息.隐语义模型(Latent Factor Model,LFM)作为一种经典的推荐算法被广泛应用于各种推荐系统.但是传统的LFM只是单一地使用了用户对物品的评分信息,导致推荐质量不佳.因为社交、物品标签与物品类别信息的广泛运用使得推荐系统在数据稀疏的情况下能获得更高的推荐准确度,所以本文将社交和物品信息融入LFM中,可以更好地描述用户和物品的概况,从而可以更了解用户偏好,为其推荐合适的物品.本文提出一种新的算法框架,不仅融合了用户对物品的评分信息和用户的社交关系信息,还融合了物品信息,综合这些信息为推荐模型提供约束,所得到的结果不仅是相似用户的偏好,也是潜在的相似物品,更能保证推荐质量.通过对物品信息的利用,可以更好地寻找到潜在相似物品,做出更好的推荐.物品间的相似度主要是通过物品的标签或类别向量来计算的,但由于标签或类型数据的稀疏性,导致物品间的相似度计算结果并不理想,从而影响推荐精度.因此本文利用潜在语义索引(Latent Semantic Index,LSI)技术来处理物品信息,以更好地刻画物品间的相似度,对相似程度不同的物品给予不同的权重,可以有效发现潜在相似物品,从而提高推荐质量.在Douban数据集上和Last.fm数据集上实验,实验结果表明提出的算法可以提高推荐精度.针对LSI技术只是依靠物品自身所标注的标签,而未能统筹并综合利用所有物品标注标签的弊端,本文还利用了改进的LSI技术来处理物品信息.改进的LSI技术通过全局统筹标签和物品之间的关系,构建出标签频数权重,标签局部权重和物品全局权重这三个部分,通过它们联合作用来获取标签-物品矩阵,更有效地利用标签信息,能有效提高推荐准确度.在Last.fm数据集上进行实验,实验结果表明标签信息对推荐质量有着重要的影响.