论文部分内容阅读
推荐系统是目前热门的研究方向之一,其涉及了信息检索,数据挖掘,机器学习,复杂网络以及社会学等不同研究领域。虽然目前推荐系统得到了长足的发展,但仍然面对着冷启动,稀疏性,可扩展性等问题。随着推荐系统的数据越来越完善和丰富,为了能够得到更好的推荐效果,推荐系统会把多种数据源信息融入到推荐算法中。标签信息就是其中一种重要数据信息,本文以此作为切入点进行研究。在评分预测场景中,为了提高推荐算法的评分预测能力,缓解冷启动和稀疏性问题,本文提出了多维标签融入基于近邻和基于矩阵分解的协同过滤的方法。该方法根据标签之间的联系对标签进行了组合,丰富了标签信息,并结合用户标签和物品标签信息,组成多维标签信息。在近邻协同过滤中,本文利用用户-多维标签矩阵计算用户相似度,利用物品-多维标签矩阵计算物品相似度,并使用线性加权的方法把多维标签相似度与协同过滤的评分相似度混合,最后进行评分预测。基于矩阵分解的协同过滤是目前流行的推荐算法,隐式反馈矩阵分解能够利用隐式反馈数据增强推荐效果,本文将多维标签信息作为一种隐式反馈数据,将用户-多维标签矩阵转化为二元反馈矩阵,融入到矩阵分解中。Top-N推荐就是给用户推荐其感兴趣的项目列表。对于该场景,本文基于排序学习的思想,提出基于分类排序的推荐方法。该方法应用混合推荐的瀑布式框架,在协同过滤的推荐结果基础上,利用逻辑回归分类模型解决Top-N推荐列表的排序问题。逻辑回归模型对用户对物品是否感兴趣进行分类并利用输出分值对Top-N推荐列表进行排序,其中模型使用了多维标签信息作为输入特征,同时利用了流行的在线算法FTRL(Follow the Regularized Leader)进行优化,解决算法的可扩展性问题。实验表明本文提出的基于多维标签信息协同过滤,有效地提高了推荐算法的评分预测效果,能够在一定程度上缓解推荐算法的冷启动和稀疏性问题。此外,对于TopN推荐,本文提出的基于分类排序的方法,能够提高Top-N推荐列表的推荐效果。