论文部分内容阅读
随着信息技术的飞速发展,用户在享受互联网带来极大便利的同时也面临着日益严重的信息过载的问题,这使得用户在海量的网络资源中难以快速而又准确地找到真正感兴趣的信息。个性化推荐系统作为解决信息过载的有效手段,在此背景下应运而生。在众多推荐算法中,协同过滤算法应用最广,但目前仍面临着数据稀疏性与冷启动等问题。社会化标签系统作为web2.0时代的重要产物,为传统的推荐系统提供了标签这一极具价值的数据来源。将标签信息作为用户与资源信息的补充能够更加准确地获取用户偏好与资源特征,将社会化标签与个性化推荐算法相结合能够有效改善推荐效果。本文对传统的基于项目的协同过滤算法进行了分析,针对其存在的数据稀疏性以及未考虑项目自身特征等问题,利用聚类后的标签簇反映项目的主题信息特征,提出了基于标签聚类与项目主题的协同过滤推荐算法,通过实验分析并验证了算法的有效性,随后在此基础上设计了一个基于本文算法的协同过滤推荐系统原型。本文所做的主要工作如下:(1)阐述了国内外学者对推荐系统的研究与取得的成果,介绍了推荐系统的原理与相关技术,重点分析了主流的推荐算法及存在的问题。(2)对社会化标签系统进行了介绍,分析了利用社会化标签进行个性化推荐的研究现状,对其中存在的标签数据量过大及标签语义模糊等问题进行了分析,在此基础上利用复杂网络中用于社团划分的连边社团检测算法对标签进行聚类,解决标签信息的语义模糊问题。(3)介绍了传统的基于项目的协同过滤算法,针对算法存在的数据稀疏性及目标项目最近邻选取不准确等问题,提出了基于标签聚类与项目主题的协同过滤推荐算法,利用聚类后的标签信息代表不同的主题,计算项目间主题相似度,并将其与项目评分数据相结合来计算项目间综合相似度,进而选取目标项目最近邻进行评分预测并产生推荐,通过与其他算法的对比实验分析验证了该算法的效果。(4)结合软件工程思想与对本文算法研究,设计了一个基于标签聚类与项目主题的协同过滤推荐系统原型,对系统进行了概要设计与主要模块的详细设计。