论文部分内容阅读
随着web2.0的发展,豆瓣、Youtube、Facebook等诸多社交网站逐渐兴起,网络用户不再仅是信息的阅读者,而成为了信息的发布者。用户可以上传资源,并且允许使用任意的称为标签的文字对资源进行标注。标签系统成为了互联网推荐系统中不可或缺的组成。但由于标签具有UGC(User Generate Content)及Free Tagging的特征,使得标签系统存在信息量过载、垃圾标签等问题,影响推荐系统的精度及个性化程度。如何在推荐系统中更合理的应用标签系统是解决以上问题的关键。本文的主要研究内容如下。首先,深入分析了标签系统的各项特性,以及标签系统在推荐系统中所起的作用。介绍了基于标签的用户模型,并概述了目前比较常用的几种推荐技术,和标签在它们之中的应用方法。其次,根据基于图的推荐算法,利用两种标签的权重对已有的三部图扩散算法进行了改进,一定程度提高了推荐的准确性和个性化。考虑到标签的桥梁作用,我们还提出了一种新的以标签为中心的带有标签权重的三部图模型,将这一模型应用于推荐算法。然后,考虑到推荐系统的时效性,我们又提出了一种综合考虑标签的使用频率和时间因素的用户-资源评分矩阵。这种评分矩阵是将用户对资源的好感度作为资源的“评分”,能够更好的反映用户兴趣随时间的变化,有利于捕捉用户的最近兴趣。将新的评分矩阵应用于协同过滤算法来为用户做出推荐。最后,对本文提出的两种基于三部图的算法和一种基于标签时间权重的协同过滤算法分别进行了对比实验,并就预测精准度和多样性等方面对算法进行了分析。