基于Self-Attention的购物车序列推荐算法研究

来源 :吉林大学 | 被引量 : 1次 | 上传用户:hanson1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能化逐渐走入人们的生活,计算机技术被用来服务各个行业。购物车序列推荐(next-basket recommendation)根据用户的购物历史,预测用户在下一次购买中选中的商品,是一种序列推荐算法,它被广泛应用于电子商务等行业中。与物品序列推荐(next-item recommendation)不同,购物车序列推荐更复杂,用户的一次购买单位是一个购物车,根据已有的购物车集合,预测下一个购物车中的物品。除此以外,序列推荐算法还可以应用于医疗等行业,如根据病人的就医记录,预测可能的病情走向。在以往工作中通常使用基于马尔科夫链(MC)和基于循环神经网络(RNN)的方法解决购车序列推荐的问题,但这些方法仍有各自的局限性,如马尔科夫链方法常建模近几次的用户行为进行推荐但难以关注用户的长期历史,循环神经网络的方法以顺序网络结构拟合数据的时序关系但忽视了物品之间的关联性。近年来,Self-Attention方法在自然语言处理(NLP)领域中取得了不错的成绩,不同于以往的方法,它可以基于更少的时间步数挖掘出词与词之间的相关性,并能像循环神经网络一样关注较长的上下文信息。为解决先前方法的局限性,本文从挖掘物品之间和购物车之间的相关性以及用户历史中的重复行为作为研究入手点,将Self-Attention 方法引 入到购物车序列推荐 中并最终做出 推荐。首先本文将Self-Attention方法适配到购物车序列推荐问题中,基于此提出一种双向的序列推荐模型,双向模型使得任意位置可以感知全部上下文信息,全方面建模用户偏好,解决模型难以感知数据中关联性的问题。其次为了使模型可以从用户交互历史中有效学习到这种隐含关系,本文研究引入了 BERT模型结构,针对购物车推荐问题本文提出了两个不同的训练任务。第一个训练任务用来学习同一个购物车中物品之间的相关性,以同一购物车中的物品构建模型的输入,以随机生成多个令牌的方式遮盖住部分物品,通过其它已知物品预测遮盖住的物品,进而使模型捕捉到同一个购物车中的物品间的隐含关系;第二个训练任务以用户的全部购物历史构建模型的输入,通过已知的购物车数据预测最后一个购物车中的物品,以此挖掘购物车与购物车之间的作用关系,这一任务同时也是本文的目标任务。为处理购物车序列推荐问题的特殊性,本文同时训练两个任务并将两个不同损失值相融合共同反向传播,两个不同训练任务从多角度拟合用户的历史行为,挖掘有效信息。随后本文针对两个训练任务在时序信息上的不同,让模型在两次训练中进行单、双向结构的变换。在第一个训练任务中采用双向结构,从前后两个方向对物品的相关性进行抽取;在第二个训练任务中将双向结构转换为单项结构,限制购物车间的信息逆向传播,在时序关系上后发生的购买行为不应影响先前的购买行为。最后本文研究了用户高频发生的重复购买行为,随着模型不断的训练一些长期的历史信息强度会减弱,为了提高历史购买信息对结果的影响,本文将模型预测与用户的历史行为信息相结合,融入重复购买信息,使用可学习影响因子矩阵平衡二者对结果的影响比例。最终本文使用两种评价指标将提出的方法同先前的方法对比,实验结果表明,本文提出的购物车序列推荐算法能够更好地捕捉序列中物品间及购物车间的相互关系,合理建模用户偏好,较先前的方法有更优的推荐效果,并在预测未曾出现在用户购物历史中的物品时有更突出的推荐能力。
其他文献
<正>互联网时代的到来,丰富了人们的生活方式,同时也衍生出多样化的社交方式。现如今,随着智能设备的普及,人们逐渐开始使用电子设备进行社交,以此满足自己的社交需求,这种社交方式没有随着时间的流逝而逐渐被人们所遗忘,反而随着社会的变迁发展,变得越来越常态化。为了进一步促进网络社交方式的发展,让人们逐渐适应这种新型社交方式,有关部门需要对年轻群体进行适当的引导,帮助其正确通过社交平台,从网络渠道与他人进
期刊
真菌次级代谢产物十分丰富,是天然药物的重要来源。我们的研究对象是本实验室自主分离获得的大团囊虫草菌(Tolypocladium ophioglossoides L2)。课题组在前期工作中对菌株进行了全基因组测序,经生物信息学分析,通过高表达bln簇内调控基因bln R,成功激活了该隐性基因簇并成功分离鉴定到balanol和其他新产物。Balanol是非选择性靶向蛋白激酶C(PKC)和c AMP依赖
学位
目的 观察中医药综合干预对糖尿病前期(PD)患者糖脂代谢的影响。方法 选取2020年3月—2022年2月北京中医药大学房山医院月华分院综合内科门诊收治的184例PD患者作为研究对象,按照随机数字表法分为对照组92例和观察组92例。对照组患者采用二甲双胍+饮食控制干预,观察组患者在对照组基础上联合中医药综合干预。2组干预疗程均为3个月。比较2组干预前及干预1、2、3个月后的体质量,干预前、干预3个月
期刊
<正>糖尿病前期是发展为糖尿病的可逆过程[1-2],主要为糖耐量减低和/或空腹血糖受损。2020年我国2型糖尿病患者已经超过1亿[3-4]。为进一步减缓糖尿病前期向糖尿病转化,关键在于糖尿病前期把控和干预,这也符合我国慢性病的政策防控[5]。间歇性断食是指正常能量摄入和能量摄入受限交替进行的一种新的饮食模式[6],相较于传统的节食模式,带来更多的减重获益,同时能够维持β细胞稳态,改善葡萄糖耐受性,
期刊
目的 探讨饮食行为护理在糖尿病前期患者中的应用效果,分析对其饮食行为遵医情况、情绪状态、糖代谢指标等的影响。方法 选择2020年9月-2022年9月本院收治的糖尿病前期患者50例为对象。随机按照信封法原则将患者分为对照组、观察组,每组各25例。对照组饮食一般性护理,观察组实施饮食行为干预,比较两组饮食行为遵医情况变化,借助量表调查两组患者情绪状态、生活质量,检测其糖代谢指标并比较,调查护理满意度并
期刊
<正>2型糖尿病前期是介于血糖正常与2型糖尿病中间的一种状态,分为糖耐量受损,即空腹血糖<6.1毫摩尔/升、餐后2小时血糖为7.8~11.1毫摩尔/升;空腹血糖受损,即空腹血糖6.1~7.0毫摩尔/升、餐后2小时血糖<7.8毫摩尔/升。这两种情况都表明身体对血糖的调节能力出了问题。
期刊
随着互联网技术的不断深入发展,网络中传输的数据在数量和种类上都呈现快速上升的趋势。对网络中的数据进行监控和审查,以提升网络服务质量、加强监管、保障网络安全变得尤为重要。传统的基于中间人的加密数据检测算法使用接收数据包、解密数据、检测数据、再加密数据的方式实现。这种检测方式不仅会造成隐私泄露,而且解密数据包的行为违背了加密传输协议的设计初衷。因此,如何设计一种能够实现在保护通信双方隐私的前提下实现数
学位
糖尿病视网膜病变(DR)和糖尿病黄斑水肿(DME)是长期危害糖尿病患者视力的眼部疾病,如果在患病早期及时发现并进行干预治疗可以有效预防视力损伤防止失明,因此高效准确的眼底疾病自动筛查方法尤为重要。近些年基于深度学习的DR或DME自动筛查方法达到了不错的分级精度,但大多数方法只关注于其中某一种特定疾病,缺乏通用性,并且往往模型参数过大导致不易于训练和临床应用。更重要的是大部分方法都没有去直面医疗数据
学位
传统的推荐算法通过分析用户和物品之间的交互数据建模用户对物品的偏好。受限于交互数据的稀疏,这类模型可能无法从数据中学到足够多的信息来准确的建模用户偏好。为了应对这种情况,学者们将用户和物品相关的其他信息加入推荐算法中作为交互数据的补充,社交网络推荐就是通过增加用户在社交领域中的信息来缓解交互数据稀疏问题的一类方法。目前大多数利用用户社交信息的推荐算法都只是利用了社交数据中用户和用户的直接社交关系信
学位
正则表达式具有灵活高效的特点,同时还有着强大的表达能力,在许多领域中被广泛应用。非确定性有限自动机是实现正则表达式应用的重要方法,Glushkov自动机是一种不同于Thompson自动机的非确定性有限自动机。Glushkov自动机有两大优点:第一,Glushkov自动机状态数目等于m+1(其中m为正则表达式非操作符长度);第二,Glushkov自动机每一个状态的所有输入都是同一个字符。Glushk
学位