基于标签关联规则的协同过滤算法研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:b479676614
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速普及,信息检索工具的发展经历了三个阶段:从分类导航到搜索引擎,再到现在的推荐系统。推荐系统及相关推荐技术已经不知不觉中深入了人们的生活中,无论是视频网站、音乐网站或APP、社交网站、甚至是平日浏览的新闻网站都离不开推荐技术,处处能看到推荐技术的痕迹。传统的基于协同过滤推荐算法存在很多的缺陷,如稀疏性问题、冷启动问题、可扩展性问题、用户多兴趣问题等等。协同过滤算法只考虑用户间或项目间的相似性来给用户进行推荐,忽略了用户对项目的主观感受。随着Web2.0的发展,在社会化标注系统中加入的标签(TAG)元素为用户提供了一种新的方式来表达对项目的主观感受。标签体现了用户对项目的观点和用户的兴趣,而且也实现了对项目内容相对精确的描述。通过对用户产生的内容(UGC)来对互联网中的户进行社会兴趣挖掘具有非常重要的意义。本文提出了一种引入用户自定义标签内容的基于标签关联规则的协同过滤算法。算法在对评分矩阵填充的过程中引用了基于项目的协同过滤方法,有效的解决了传统的协同过滤算法的稀疏性问题。接着对用户的相似度的计算进行了改进,引入了用户关注度矩阵,对用户评分相似度和用户关注度相似度两部分相似度进行了改进。在这里我们引入Apriori关联规则中计算频繁项集的思想,训练出合适的最小支持度阈值,求出频繁项集,对频繁项集分解得到用户兴趣点,再逆向遍历用户集合,按照用户兴趣点对用户进行聚类。得到用户聚类后,按照前面介绍的改进的用户相似度方法,求出最近邻居用户集合,进而求出用户对项目的预测评分,最后将结果推荐给用户。实验采用MovieLens电影评分数据集,通过一系列的实验对各推荐算法进行对比。实验表明该方法能有效的降低评分矩阵稀疏带来的影响,提高了预测精度。
其他文献