【摘 要】
:
传统推荐系统通常根据用户的身份标识信息和用户在此网站长期的历史交互行为来构建用户的画像特征,以便充分挖掘该用户的兴趣,并向该用户进行个性化的推荐。这些方法通常只关注用户的长期静态偏好,将用户的历史交互序列分解为多个静态的用户-物品记录,忽略了用户偏好随时间的转移。此外,在某些场景中,用户的身份标识信息可能无法利用。例如,一些用户非常重视隐私问题,通常情况下会拒绝提供本人相关的身份标识信息,或者通过
论文部分内容阅读
传统推荐系统通常根据用户的身份标识信息和用户在此网站长期的历史交互行为来构建用户的画像特征,以便充分挖掘该用户的兴趣,并向该用户进行个性化的推荐。这些方法通常只关注用户的长期静态偏好,将用户的历史交互序列分解为多个静态的用户-物品记录,忽略了用户偏好随时间的转移。此外,在某些场景中,用户的身份标识信息可能无法利用。例如,一些用户非常重视隐私问题,通常情况下会拒绝提供本人相关的身份标识信息,或者通过匿名的方式访问应用系统。在此场景下,依赖于用户身份标识的传统推荐算法将不再适用。一种有效的解决方式是将用户从登录到退出应用系统的这段时间内与系统进行交互得到的物品序列组织为会话,将会话作为推荐的基本单位。会话型推荐系统基于用户的当前会话预测用户下一次可能的点击。会话感知型推荐系统是一种特殊形式的会话型推荐系统,同时考虑用户在当前会话中的短期行为以及历史会话中隐含的长期或一般偏好,根据用户的历史会话和当前会话预测用户下一次可能的点击,以达到更好的推荐效果。尽管现有的会话感知型推荐方法已经在各自的应用领域取得了卓有成效的成果,但是它们仍存在某些不足。一方面,这些方法通常将会话建模成序列,只对两个相邻物品之间的单向转移关系进行建模,难以捕捉在序列上彼此远离的物品之间的关系;并且它们也忽略了账号在物品上的停留时间这类辅助信息的影响。另一方面,这些方法通常默认将一个账号看作一个个体来对待,面向单用户提出推荐建议,忽略了现实生活中普遍存在的共享账号场景。针对以上问题,本文提出了一种基于多用户共享账号的会话感知型推荐模型——MISS(Multi-user Identification Network for Shared-account Session-aware Recommendation),能够根据账号的历史会话和当前会话识别不同潜在用户和当前用户,从而针对当前用户进行个性化推荐。MISS模型主要包含两步。第一步,提出了一个停留图神经网络(Dwell Graph Neural Network,DGNN),将系统中每个账号的所有会话按照一定的规则构建成加权有向图。考虑到用户在物品上的停留时间中隐含的偏好程度信息,将物品停留时间融入了会话图的构建过程。然后使用图神经网络捕捉在会话图中物品之间复杂的转移关系,以生成所有会话对应的特征向量。第二步,为了识别共享账号中的不同潜在用户,并对当前用户进行个性化推荐,提出了一个多用户识别网络(Multi-user Identification Network,MIN)。首先假设账号中有M个潜在用户,对于账号中的每个用户,使用自注意力机制计算每个历史会话属于该用户的可能性权值,然后对所有会话向量进行加权求和,以此得到该用户的一般偏好特征。之后,通过比较当前会话中的当前用户偏好与潜在用户特征向量,计算每个潜在用户是当前用户的可能性权值,得到当前用户的长期偏好特征。最后,将当前会话中用户的短期行为目的与学得的用户一般偏好特征向量拼接,得到最终的当前用户特征向量,进而完成对当前用户的个性化推荐任务。本文的主要工作及贡献概括如下:1.本文提出了基于共享账号的会话感知型推荐的新任务,并针对该问题设计了一个完整的模型框架MISS。该模型能够有效捕捉账号的历史会话和当前会话中的物品之间的复杂转移关系以提取会话特征,并根据账号会话特征识别共享账号中的不同潜在用户,提取当前用户的兴趣偏好特征,对当前用户进行真正的个性化推荐,从而提高推荐系统的性能。2.本文设计了一种会话特征提取方法——停留图神经网络,以及基于自注意力机制的多用户识别网络。停留图神经网络跳出了传统的序列建模思路,将账号会话建模成图,并将用户在物品上的停留时间这类辅助信息与模型相结合,以更好地捕捉物品之间的复杂转移关系;利用停留图神经网络从账号的历史会话和当前会话中提取的兴趣偏好特征,多用户识别网络使用自注意力机制识别共享账号中的不同潜在用户和当前用户,以建模当前用户的长期偏好特征和短期行为目的,从而对当前用户进行真正的个性化推荐。3.本文基于海信互联网电视平台收集的观看日志构建了两个具有共享账号特征的数据集,并进行了大量的实验分析。实验结果显示,MISS模型在HR和MRR这两个评价指标上均优于所选取的基线方法。此外,本文还设计了消融实验来验证模型中两个关键模块的性能,并分析了超参数M对推荐效果的影响。
其他文献
股权让与担保作为一种增信手段以其无法替代的优越性受到越来越多融资主体的青睐。但让与担保自被创造之始,合同效力就广受争议,甚至被冠以“私生子”之名。很多学术界及司法实务界人士都认为让与担保双方所签合同应为无效。认为其无效的理由主要有:双方系虚伪意思之表示;物权法定原则之违反;禁止流质之触犯。针对上述理由,已经有很多学者进行了质疑与批判。经过多年的司法实践,司法实务界也从一开始对合同效力不能形成统一裁
碑刻不仅是记录史实的重要载体,而且还具有深厚的学术、文化内涵。在历代官方文献和私家著述中,关于伊斯兰教的记载都是一鳞半爪,但是这些记载散见于全国各地的清真寺碑刻中。清真寺碑刻通过对穆斯林社会的政治、经济、文化等不同层面的如实记载,堪称一部刻在“石头上的穆斯林历史”。要想了解伊斯兰教在中国的传播、发展与演变,就绕不开对清真寺碑刻的研究。当前在倡议“一带一路”、铸牢中华民族共同体意识、坚持伊斯兰教中国
随着近年来人们生活方式改变,增强现实、机器人等高新技术的应用越来越广泛,物体姿态估计也变得越来越重要。由于物体姿态具有6个自由度(3个旋转量和3个偏移量),因此物体姿态估计也称物体6D姿态估计,该任务旨在估计物体在相机坐标系下的位置和方向。对物体6D姿态估计这一任务的深入研究,可以为场景理解,增强现实,机器人控制和导航有关的各种问题提出更有效的解决方案。同时近几年,视觉深度传感器的发展和深度数据的
数据是深度学习的关键,深度学习在图像分类问题上取得了重大的进展,一个重要的原因是拥有大量有标签的数据。CIFAR-10、CIFAR-100和ImageNet等有标签的开源图像分类数据集推动了深度学习在学术界的发展,但在实际工业场景中,有标签的数据仍是少数,大部分数据是无标签的。而数据标注一直是昂贵且费时的,在一些特定的领域,如医学图像分析,甚至要求标注者具有一定的专业知识。主动学习和半监督学习是两
自动式家具摆放方式生成任务在室内家装设计、虚拟现实、计算机视觉等需要数字化室内场景的领域中有广泛的应用场景。传统方法在预先定义家具的位置、功能、合理性等规则后,利用顺序迭代或能量优化的方式进行家具摆放。然而规则的定义以及优化迭代的过程会造成大量人力及时间的消耗。随着大规模室内场景数据集的出现,人们开始探究利用深度学习的方式进行家具摆放,因此需要能够在给定家具和房间结构条件下完成家具摆放任务的神经网
电子商务的蓬勃发展,带动了服装行业的快速发展,这也造成了互联网中服装商品数据(衣服图像、文本描述等)的爆炸式增长。为了有效解决互联网中服装数据过载的问题,帮助用户快速、准确地搜索理想的服装商品,基于图像的服装检索方法应运而生并被广泛应用在搜索引擎、在线购物等系统中。该方法允许用户简单地上传一张描述其需求的服装图像来检索满意的服装商品。然而在现实场景中,用户很难获取一张完全满足其需求的查询图像。用户
随着互联网技术的发展,用户娱乐需求旺盛,越来越多的在线视频网站兴起,如爱奇艺、腾讯视频等,其用户规模与视频资源在逐步扩大。相较于传统的电视节目,在线视频网站给予用户更多选择权,能够依据自身兴趣偏好选择视频观看。但是并非所有视频资源都是免费的,相当多的电视剧或电影资源需要用户付费成为会员之后才有权观看。为享受更多更优质的视频资源以及更良好的观看体验,越来越多的用户购买会员服务,但是用户是否购买会员往
近年来,随着互联网的发展和多媒体设备的普及,不同种类搜索引擎和社交媒体应运而生,人们越来越倾向于用不同模态的数据表示同一事物,人们对于进行模态间搜索的现实需求越来越大,跨模态检索方法研究成为人们急需面对的重要议题和热门研究课题。该方法旨在通过计算不同模态数据之间的相似度,为给定的某种模态的查询数据,检索出与其内容相关的其他模态的数据。由于低存储成本和快速的查询速度等优点,跨模态哈希检索方法能够有效
能源是人类社会赖以生存和发展最重要的物质基础之一,能源的开发和利用贯穿了人类社会的发展历程。然而,随着社会的发展,能源需求急剧增长,某些领域能源危机愈发频繁,能源短缺问题逐渐成为制约社会发展的关键因素之一。因此,“节能降耗”被世界各国提上了日程。在众多的能源类型中,电能在社会生产和日常生活中扮演了越来越重要的角色,因此电能节约是推进节能降耗工作的重中之重。与此同时,电能的广泛使用也带来了潜在的用电
青年就业是世界性难题,我国也不例外,以高校毕业生为主的青年就业压力将依然突出,青年就业难、失业率居高不下的问题引发社会高度关注,在这一形势下,以创业带动就业对缓解青年就业问题具有重要现实意义。各地团组织要牢牢把握住团的主要生命力即为青年,只有做好青年工作,特别是就当前针对青年就业创业而言,只有做好服务青年就业创业工作,才是彰显共青团群众性最重要的方面。较山东省其他县区而言,广饶县作为全国百强县,工