论文部分内容阅读
随着互联网技术的飞速发展,标签系统得到广泛的应用并且成为众多Web2.0网站的重要组成部分。标签系统是为用户提供标签标注功能的应用系统,因为其方便操作、容易使用等特点深受网络用户的青睐。典型的标签系统有Delicious、Flickr、Last.fm和CiteULike等。标签推荐是标签系统的一个重要功能,它可以提供合适的标签给用户,这些标签一般是用户感兴趣的或是符合用户特点的。标签推荐既方便用户的操作又提高了标签系统标注的质量。在标签系统中用户、标签和资源之间构成一个三维模型。为了使用传统的推荐方法,现有的标签推荐方法大多通过将三维模型拆分成多个二元关系进行处理,对标签的信息也只是采用了一些简单的表示。这个转换过程容易出现语义丢失,导致标签的个性化信息没有得到很好的利用。标签对用户和资源都有着重要的意义,应该进行全面的考虑。标签系统中既存在活跃的用户,也存在标注次数较少的用户,在进行个性化标签推荐时,对于用户标签数量较少的冷启动用户也需要进行考虑。针对现有方法存在的不足,本文提出了一种基于图模型的个性化标签推荐方法。该方法考虑到标签系统中用户、资源和标签的整体性,将三维模型转化成一个加权三部图进行处理。对三部图中相邻顶点采用一种综合的权重衡量方法,既考虑标签的热门程度,又考虑了标签的个性化特点。不相邻顶点的权重通过最短路径的思想得出。最后,综合考虑标签与用户,标签与资源的之间的关系给出用户个性化标签列表。本文分别在CiteULike和Last.fm两个数据集上进行了相关实验,并与传统的标签推荐方法进行比较,结果表明,不管是活跃用户还是冷启动用户,本文提出的方法都具有更好的推荐性能。