基于数据增强与注意力机制的电商推荐算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zzyu888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务领域由于其庞大的用户群体和商品数量,成为了信息过载问题的“重灾区”之一,因此优秀的电商推荐算法成为了众多大型电商平台的支撑技术和必备武器。提升电商领域的推荐算法性能,一方面可以避免用户迷失在庞大的商品森林之中,另一方面可以极大的提升商家和平台的成交额与收益。在传统的电商推荐场景中,由于大多数可利用的特征之间没有明显的空间或时间关系,因此循环神经网络等方法在该领域难以得到运用。基于会话的推荐算法核心思想是将用户的所有历史行为序列划分为会话,从而将自然语言处理与序列数据处理的方法引入推荐算法中。研究发现真实电商场景下的原始会话数据,大多存在会话数量不足、会话过短以及会话分布不均衡等现象;现有大多数基于会话的推荐算法并未严格区分不同类型的数据特征,使得大量序列数据以外的基本属性特征未能得到充分的利用;同时基于简单循环神经网络的模型往往只能关注当前会话内的用户兴趣,而无法挖掘会话之间隐含的信息。为解决上述的问题,本文分别在数据增强层面与模型改进层面对现有的基于会话的推荐算法进行改进,提出了四种改善会话数据集的数据增强方法,以及一种基于注意力机制的会话推荐算法。本文的主要研究工作如下:1.为了解决了真实推荐场景中存在的会话数据不足、会话过短以及分布不均匀等问题,将图像处理与自然语言处理领域的数据增强方法应用到电商场景的数据增强中,并改进了四种基于会话的推荐算法数据增强方法:EDA、WS、seq2seq以及DeepWalk。这些方法在借鉴原方法的基础上都针对电商环境进行了相应了改进,使其更适用于用户会话的数据增强。实验结果表明,这些方法可以有效的改善原始会话数据的质量,从而在数据层面上提升基于会话的推荐算法性能及其可扩展性。2.为了解决原有的会话推荐算法对于基础属性特征利用不足以及会话兴趣表达有限的问题,提出了一种由DeepFM模块与注意力会话模块串联的基于注意力会话的深度因子分解机模型(ASDeepFM)。本文通过对电商推荐场景中的数据特征进行分析,首先将模型可利用特征分为用户和商品的基本属性特征与用户的历史行为序列特征。我们使用深度因子分解机处理无时间与空间关系的基本属性特征,同时基于多头注意力机制的方法提出了专门处理用户行为会话的注意力会话模块。该模块包括了会话划分、会话内注意力提取及会话间注意力等部分,它可以充分地利用历史行为中的序列信息来挖掘用户的长短期兴趣,从而达到更好的推荐效果。最后本文将DeepFM模块与注意力会话模块进行串联,提出了基于注意力会话的深度因子分解机模型(ASDeepFM)。通过实验证明,本文提出的ASDeepFM模型在两个公开数据集上都取得明显的性能提升。
其他文献
当前全球数字化社会建设日益成熟,云服务日渐得到个人、组织机构和大型企业的青睐,可预见未来所有的组织机构都将使用云服务。与此同时,文件共享和文件协作是近六年来使用率最高的云服务类别,这对云服务中文件共享和文件协作、以及文件同步技术提出了更严峻的挑战。针对云同步技术收到的挑战,如何提升云同步性能,为庞大的用户群体提供优质的服务是亟需解决的问题。首先,分析现有云同步技术在大规模应用云服务场景下的同步效率
21世纪进入了信息化的时代,信息化已经进入各行各业,并且信息化技术变成了当今世界上发展最迅速的产业,与此同时,人们对信息化的要求越来越高,对信息化的需求的变化日新月异。我们如何能快速完成项目的上线,如何能快速响应需求的变更一直是各个技术团队希望解决的问题。要解决这个问题,需要拥有一个高效快速的二次开发系统,能让系统更快的投入生产,更能拥抱需求的变更。而一个高效快速的二次开发系统首先系统架构上要整体
随着互联网的高速发展,越来越多的网民在社交平台发表言论,促进了世界的多元化交流。但问题也随之而来,大量的谣言也在社交平台上传播,一些涉及公共安全的谣言,更是对社会稳定造成巨大伤害。然而目前的谣言检测侧重于文本特征、用户信息以及传播结构信息,它们本质上仍然是通过分析用户的发布意图来检测文本的虚假性,却忽略了知识的重要性,在目前谣言数据集数据量少、收集困难的情况下更是影响到谣言检测的性能,因此外部知识
核电站的兴起缓解了当今的日益增长的能源供需矛盾。然而,2011年发生于日本福岛核电站的重大核事故再次使人们将目光集中在核安全的问题上,该事故暴露了燃料颗粒包壳锆合金在高温水蒸气下易发生锆水反应释氢的安全问题。基于该背景下,一种被称为“事故容错燃料”(Accident-tolerant fuel,ATF)的技术概念得以提出。在该技术概念中表面覆膜技术因其成熟的工艺和应用而受到青睐,其中非晶/晶体纳米
人们的日常生活和软件应用服务越来越无法分离。为了应对不断变化的需求,软件开发团队能够快速的对产品进行迭代变得越来越重要。随着微服务、DevOps、容器技术的逐步发展,云原生应运而生,为软件应用服务的快速迭代提供了解决思路。目前谷歌开源了 Kubernetes为容器的管理提供了帮助,但主要是作为容器的编排工具,不能够完全涵盖云原生应用从源代码到发布的整个流程。本文基于Kubernetes实现了一个云
甲骨文,是中国最古老的象形文字,在漫长的汉字发展史上起着举足轻重的重要地位。但要识别未释读的字或者收集、分类相关实例内容是需要花费很多的时间和精力。而利用图像检索技术可以在海量的图像大数据中以较小的时空开销准确地找到一幅相似的图像,图像检索也成为近年来多媒体和信息检索领域的重要研究热点。因此,如何利用图像检索技术对甲骨文图像进行分类与识别的研究也具有非常重要的意义。图像检索的本质是通过对图像进行特
多标签图像分类是图像分类领域的一个重要研究课题,是对单标签图像分类任务的拓展。相对于单标签图像分类任务,多标签图像分类具有更大的复杂性,并且由于标签之间存在一定的相关性,所以探索标签之间的相关性来辅助多标签分类是一个十分有意义的课题。本文以多标签图像分类为目标,重点探索模型各部分蕴含的标签相关性对模型性能的影响。主要基于ResNet骨干网络进行改进,并在基准数据集(MS-COCO和NUS-WIDE
隐喻是一种常见的修辞方式,可以增强语言的渲染能力,提升感官体验,促进说者与听者的共鸣。除了修辞层面上的功能,隐喻更是人类的一种认知手段和思维方式,是人类概念系统塑造的基础。认知和修辞上的功能使得隐喻活跃于各类自然语言交流场景中,同时大量隐晦含蓄的隐喻表达也成为了自然语言处理任务必须直面的一个难点。隐喻计算包括隐喻识别与隐喻理解两大模块。隐喻识别旨在对语料中的隐喻表达加以区分,供后续的隐喻理解模块处
行人重识别旨在不同摄像头下寻找相同行人图像。它在智能安防和智慧零售中具有十分重要的作用。随着深度学习技术的发展,行人重识别模型的识别精度逐渐提升,已经达到较高识别精度。但是这些方法往往需要大量高质量的标注数据训练模型,并且模型易局限于特定的场景,不能很好地泛化到新场景中进行应用,故行人重识别中的无监督学习和无监督域适应问题成为了近年来研究的热点。本文针对这两方面问题,分别提出非对称协同教学网络(A
在计算机辅助设计(CAD)系统中,等距曲线具有有理形式的参数曲线称为OR曲线,可以分为两类:一类是Pythagorean Hodograph(PH)曲线,它的等距曲线是一个有理多项式;另一类是indirect-PH(间接PH)曲线,它的等距曲线不是有理多项式,但经过合适的参数变换后,在新参数下是一个有理多项式.平面Bézier曲线具有非常广泛的应用,但在通常情况下,一条平面Bézier曲线的等距曲