基于时间效应的推荐算法比较研究

来源 :安家（校外教育） | 被引量 : 0次 | 上传用户：hrmcttkl

【摘要】

：

【作者】

：

牟斌皓

【出处】

：

安家（校外教育）

【发表日期】

：

2021年19期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：推荐系统根据用户的历史行为数据分析用户兴趣，自动地为用户推荐感兴趣的物品。传统的推荐算法往往忽略用户所处的上下文，时间作为最重要的上下文信息，直接影响推荐质量。本文通过比较分析五种基于时间效应的推荐算法，说明时间效应对于推荐质量的影响。
　　关键词推荐系统;协同过滤;推荐系统上下文;时间效应
　　中图分类号：G4 文献标识码：A
　　传统的推荐算法主要研究用户兴趣和物品之间的关系，往往忽略了用户所处的上下文。上下文主要包括用户访问系统的时间、地点、情绪和季节信息等。上下文信息直接影响推荐质量，一个好的推荐系统应该能根据季节为用户推荐当季的物品，根据用户的情绪为用户推荐最适合的物品，并能根据时间上下文感知用户兴趣迁移。
　　时间上下文作为最重要的上下文信息，对于推荐质量至关重要。时间效应对于推荐系统的影响主要表现在以下方[1]：
　　一、动态变化的用户兴趣
　　一个最基本的事实是：用户的兴趣是动态变化的，没有一个推荐系统可以做到“一劳永逸”，比如一个用户在小学期间喜欢看动漫，初高中喜欢看武侠小说，大学期间更加偏爱文学著作。用户的兴趣必然随着时间变化发生改变，推荐算法也必须考虑时间效应进行推荐。
　　二、物品具有生命周期
　　推荐系统中的物品必然存在生命周期。比如一个商品，刚上市时时爆款，随着时间迁移以及其他商品的上市，这个商品渐渐变得不再那么受人关注。不同物品的生命周期不尽相同，比如电影的生命周期一般比新闻更长。
　　1 基于时间效应的推荐算法
　　1.1 时下热门推荐算法
　　时下热门推荐算法基于历史热门推荐算法，为用户推荐时下最热门的物品，给定某一时刻T，物品i的时下流行度可以定义为：
　　其中为时间衰减项，值依据不同的数据集而定，下文将时下热门算法简称为CH算法。
　　1.2 基于时间权重和物品的协同过滤算法
　　Ding[2]和Andreas[3]等在传统的协同过滤算法的基础上，提出了基于时间权重和物品的协同过滤算法，本文将算法修改后进行Top-N推荐，后文简称为TICF。
　　基于物品和时间权重的协同过滤算法的Top-N主要分为两个步骤：一是计算物品之间的相似度，计算公式如公式1-2所示：
　　其中为引入的时间相关项，为用户u对于物品i产生行为的时间点，该公式的核心思想是：用户对于物品i和物品j产生的行为时间间隔越近，时间衰减项的值约小，物品之间的相似度也就越大。其中作为衰减因子对不同系统的取值是不一样的，如果对于用户兴趣变化快的系统而言，应该设置比较大的衰减因子值。
　　二是根据用户物品相似度矩阵和历史行为计算用户对于物品的偏爱程度，计算公式如下：
　　1.3 基于时间权重和用户的协同过滤算法
　　基于用户的协同过滤算法是经典的协同过滤算法，UserCF算法也可以进一步考虑时间效应扩展成为TUserCF。
　　在找到和当前用户u兴趣相似的一组用户后，这组用户最近的兴趣显然相比这组用户很久之前的兴趣更加接近用户u当前的兴趣。也就是说，我们应该给用户推荐和他兴趣相似的用户最近喜欢的物品。所以在计算用户相似度的时候，可以通过公式1-4引入时间信息。加入时间信息后的用户u和用户v的相似度为：
　　其中公式对于相似度计算公式加入了时间项，二是通过如下公式来计算用户对于物品的喜爱程度，加入时间信息后用户对于物品的偏好程度为[4]：
　　2 实验和分析
　　本文使用All-But-One方法进行实验，采用命中率作为评价指标，考查算法Top-N推荐效果。为模拟真实推荐场景，根据时间窗口（Time Window）大小的不同，将数据集划分为训练集和测试集。对于每个用户来说，将用户最近的一次喜欢的物品作为测试集，其余的物品作为训练集，如图1-1所示。
　　实验在MovieLens 100K數据集上进行，实验比较了随机推荐算法（Random Rec，简称RR）、历史热门算法（History Hot，简称HH）、时下热门推荐算法（简称CH）、基于时间权重和物品的协同过滤算法（简称TICF）和基于时间权重和用户的协同过滤算法（简称TUCF），综合考虑时间复杂度和实验精度后，将时间窗口的大小分别设置为30天、15天和7天，五种算法在MovieLens 100K上的Top N推荐最佳命中率如表1-1所示。
　　从表1-1可以看出，对于MovieLens 100K数据集，随机推荐的命中率远远低于其他算法，非个性化的时下热门推荐算法的推荐命中率优于其他算法，甚至好于个性化推荐算法，基于物品的TICF算法的效果要优于基于用户的TUCF算法。总的来看，在MovieLens 100K上，时间上下文信息对于提高Top N推荐命中率至关重要;在考虑时间效应后，非个性化的推荐算法的表现要优于个性化推荐算法，其中时下热门推荐效果最好。同时，实验结果也反映了该数据集的时效性很强，用户的兴趣迁移很快，没有比较稳定的状态，用户兴趣的个性化不明显，用户都喜欢时下热门的物品，而长尾中的物品很少得到用户的关注。
　　参考文献
　　[1] Koren Y. Collaborative filtering with temporal dynamics[M]. ACM， 2010.
　　[2] J. B. Schafer， D. Frankowski， J. Herlocker， et al. Collaborative Filtering Recommender Systems [J]. The adaptive web， 2007， 4321： 291-324.
　　[3] Tao Zhou， Jie Ren， Matú? Medo， et al. Bipartite network projection and.
　　[4] 项亮. 推荐系统实践[M]. 人民邮电出版社， 2012.
　　作者简介：牟斌皓（1991.12-），男，汉族，四川合江人，助教，硕士，主要从事人工智能与大数据研究
　　项目名称：泸州职业技术学院校级科研项目基于时间效应和标签信息的推荐算法研究编号：K-2138

其他文献

媒体融合时代下广播电视播音主持的创新研究

摘要：随着近年来网络技术的不断发展，我国进入了媒体融合时代，网络媒体、自媒体等新媒体模式层出不穷，对广播电视行业产生了很大的影响，广播电视播音主持人也面临这巨大的挑战，需要进行有效的创新和进步。在此基础上，本文分析了媒体融合时代广播电视播音主持人面临的挑战，提出了一些工作创新和发展措施，以期促进广播电视行业健康发展，顺应媒体融合时代发展的趋势。　　关键词：媒体融合;广播电视;播音主持;创新　　中图

期刊

核心素养下的小学数学教学探析

摘要：小学数学教学的最终目的就是要提高学生的数学核心素养。在新课程改革的背景下，如何做好基于数学核心素养培养的数学教学工作，就是数学教师需要重点思考的问题。在此，本文从三方面出发，结合一定的数学教学实践，对小学生数学核心素养的培养策略進行了探讨。　　关键词：小学数学;核心素养　　中图分类号：G4 文献标识码：A　　引言：数学核心素养的内容非常丰富，包括数感和符号意识、数学运算与推理、数学模型等

期刊

浅析小学道德与法治教学中德育教育的渗透策略

摘要：德育是落实“立德树人”的重要载体，对于学生道德品质的形成与提升有着极为重要的作用。而《道德与法治》课程率先承担起立德树人的根本任务，是全面贯彻落实“德育为首”方针的主要渠道，是提高学生综合素质的重要途径.在小学道德与法治教学中渗透德育教育，不仅培养学生良好的道德素养，还对学生的成长发展有着举足轻重的重要意义。　　关键字：小学; 道德与法治; 德育教育　　中图分类号：G4 文献标识码：A　

期刊

高中文学经典品读体会

摘要：在新课程教学改革的背景之下，对高中学生们自身的文学素养也提出了更高的要求。高中学生们自身的文学素质不仅仅是在课堂上学习到的理论知识，更多的还是在课外的文学经典阅读之中。因为文学经典的原文内容大部分都是文言文，故事内容比较晦涩难懂、叙述性比较抽象，这就要求高中学生们在进行文学经典阅读的时候，还需要对文学经典中的语句、段落进行全面的掌握、理解，更好的认识到文学经典品读的魅力，提高自身的文学素养。

期刊

在新媒体艺术背景下探求山西民间舞蹈的发展

摘要：山西民间舞蹈源于山西人民真实生活写照，彰显三晋人民的精神气质，孕育出灿烂的黄河文明。然而时代更替，科技进步，传统民间艺术日渐凋落，其传承与发展也存在极大地局限性。所以，利用新媒体技术丰富山西民间舞蹈内容，创新表现形式，对其艺术魅力的保护及展现都有着重要意义。　　关键词：新媒体艺术山西民间舞蹈新发展　　中图分类号：G4 文献标识码：A　　一、新媒体艺术概述　　新媒体艺术先驱罗伊·阿斯科

期刊

播下童年的五粒种子

中图分类号：G4 文献标识码：A　　八月暑退凉风生，家家稚子入学忙。又见九月，新的一批孩童即将踏入附小的校园。今年作为一年级教师的我，最近一直在思考：在国家“双减”政策、“五项管理”规定下，我们到底该怎样培养这一个个天真烂漫、不谙世事的孩童？如何帮助他们扣好人生中第一颗纽扣？到底该在他们幼小的心田播下什么样的种子，才能开出健康的、绚烂的、幸福的花儿，使其芳香一世，润泽一生。　　“不要把小孩子的

期刊

广播电视技术与互联网技术的融合分析

摘要：当今时代，互联网技术高度发达，信息传播拥有了更多途径，如丰富多彩的社交平台、视频播放平台等，都是人们常用的信息来源途径。在这个全民网民的时代，网民数量不断增加，网络电视的受众人数不断增加，这对于传统的广播电视行业造成了一定的冲击。这对于广播电视行业而言，不仅是来自时代的挑战和冲击，也是一场难得的机遇，因此作为该行业从事者，应该聚焦于广播电视技术与互联网技术相融合，从而让广播电视行业发展得更好

期刊

小学体育课堂教学如何促进足球教育发展

摘要：足球运动在我国有着广大的民众基础，深受小学生群体的喜爱。随着体育教学改革的持续推进，在小学阶段的体育教学中所设置的足球课程占据比重不断加大。但是受到外在因素的影响，现阶段的小学体育教学中的足球教学质量有所欠缺，所展现出的足球课程教学优势不明显。基于此，本文重点分析如何通过有效的小学体育课堂教学，促进足球教育的发展，不断提升小学阶段的足球教育质量水平，为足球运动在我国教育体系中的普及助力。　　

期刊

小学生语文阅读能力提升策略

摘要：当前，对于小学阶段来讲，如何有效提升学生的阅读能力方面的研究，受到了很多一线教师们的关注，作为小学语文教师来讲，应该如何有效提升小学生阅读能力呢？带着这一想法，笔者通过查阅相关资料，并结合实际出发，探索提升小学生阅读能力策略。　　关键词：小学语文;语文教学;阅读教学　　中图分类号：G4 文献标识码：A　　一、小学语文阅读教学培养学　　生形成核心素养展示出的基本内涵阅读是小学语文课堂教学的

期刊

提高初中班主任德育工作实效性的对策

摘要：班主任是班级管理的主要领导者。初中班主任在班级管理中需要注意德育教育的渗透。本文主要分析了如何提高初中班主任德育工作实效性的相关对策，目的是促使初中生各方面健康成长。　　关键词：初中;班主任;德育工作;实效性;对策　　中图分类号：G4 文献标识码：A　　初中生正处在身心发育的关键时期，该时期的学生容易出现各种各项的心理问题。尤其是在网络时代下不良信息每时每刻都在冲击着学生。班主任在落实班

期刊

基于时间效应的推荐算法比较研究

与本文相关的学术论文