新零售背景下基于深度学习的食品杂货实时推荐研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:hyh900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务平台已经深刻地影响了人们的日常生活。但随着网购用户对电子商务平台的依赖增加,用户开始不满足于购买书籍、服装等物品,而希望能购买生鲜、熟食、水果等易腐商品以及快速获得商品,而且由于互联网人口红利消失,传统电子商务企业需要寻找新的增长点,同时,传统零售企业也需要转型升级,新零售是一个重要的发力点,而食品杂货领域正是这些企业往新零售发展的重要方向之一。因为生鲜、蔬菜、水果等食品的易腐性,不适合快递运输,以及杂货如牙膏、抽纸、清洁剂这样日常消费品的必要性以及较强的目的性会使得用户偏向于就近购买,新零售的模式非常适合于食品杂货领域。在新零售食品杂货场景中,由于用户下单通常有目的性,可以挖掘用户当前的购物意愿,因此适合实时推荐。但由于实时推荐对时效性要求高,因此本文通过分阶段的方式极大地减少了计算量,同时围绕新零售食品杂货场景高重购率、商品间关联性较强、周期性较强的特征来设计本文两阶段推荐算法以保证推荐效果。最终提出了一个适用于新零售食品杂货实时推荐的基于深度学习的两阶段推荐算法,极大地减少了计算时间同时具有良好的推荐性能,用于解决新零售食品杂货实时推荐的时效性问题,主要的研究工作如下:(1)选择新零售食品杂货APP购物车页面的实时推荐为研究场景,对其进行描述分析,介绍该场景与传统电商APP的区别。通过文献、理论、新零售数据集以及传统电商数据集,对新零售食品杂货场景的特征进行分析总结,得到其主要特点为高重购率、商品间关联性较强、周期性较强的特点。(2)大部分推荐算法研究都是离线推荐,虽然推荐结果相对较好,但计算全量数据的计算量过于庞大,计算时间长,不适合实时推荐。为解决实时推荐的时效性问题同时要保证推荐效果,本文提出一个基于深度学习两阶段推荐算法极大地减少了计算时间,同时性能良好。召回阶段为每个用户计算候选商品集,排序阶段则从候选商品中选出最终的推荐列表。描述了召回阶段的流程、排序阶段的流程以及整个推荐算法的流程和架构。(3)Triple2vec是近年来效果较好的,通过embedding向量进行推荐的模型,能较好的挖掘用户与商品间的联系以及商品与商品间的联系。本文将triple2vec用于召回阶段,同时增加了重购召回。根据召回阶段的实验结果,重购召回的商品相较于triple2vec召回有更高的召回率,但数量有限,因此采用先通过重购召回,再用embedding向量召回作为补充的方式,较大地提升了召回率。Embedding向量通过triple2vec模型训练获得后,会通过局部敏感哈希算法以常数级的时间复杂度快速进行向量检索,得到候选商品。重购召回则通过用户的商品购买记录按一定规则选取候选商品。由于重购召回的候选商品质量较高,用户再次购买的可能性大,但数量有限,而通过向量召回的候选商品质量较差,但召回数量可以自定义,且可以增加候选商品集的多样性,挖掘用户潜在兴趣,因此采用先重购召回,向量召回作为补充的方式为每个用户计算一个候选商品集。通过向量召回和重购召回的方式比单纯的向量召回和重购召回有更好的性能。(4)在排序阶段,根据新零售食品杂货场景的特点进行了特征选择。特征选择从用户相关特征、商品相关特征、用户与商品相关特征以及周期性特征四个方面出发,围绕新零售食品杂货高重购率、周期性强等特点来进行。选择3个适合新零售食品杂货推荐得模型进行实验,实验结果表明,召回+排序的两阶段推荐算法能极大的减少计算时间且性能良好;周期性特征对推荐算法性能有正面影响,新零售食品杂货品类具有周期性特征;通过PCA进行降维有效地减少了计算时间同时对提升推荐算法性能有一定作用。
其他文献
我国人口基数不断增多、人口老龄化的速度也在不断加快,随之而来的是对医疗资源需求的增加,同时随着互联网的快速发展,传统医疗与互联网的结合为患者带来了不少的便利,门诊预约管理作为互联网发展的产物,为医院的预约管理带来了新的发展。在门诊预约系统进行决策过程中存在着各种环境因素,这些环境因素都增加了调度决策的复杂性,以往对门诊医疗系统的研究主要以降低患者候诊时间和医生加班时间为目的,寻求最合理的方式将稀缺
学位
从“大众创业、万众创新”首次提出,到“双创升级”的逐步落实,创新创业对扩大社会就业、培育经济发展新动能和促进经济转型升级起到了重要支撑作用,是现阶段我国不断落实创新驱动发展战略、深入推进供给侧结构性改革和扎实促进经济高质量发展的重要政策手段。在当前经济转型升级和现代化经济体系建设的关键时期,微观经济主体的创新创业活动受到国家高度重视,中国共产党第十九次全国代表大会报告中也指出要“激发和保护企业家精
学位
并购热潮引发的商誉减值风险威胁着我国资本市场的稳定。受市场竞争及政策的支持,近年来并购重组持续增长,在以“高估值、高业绩承诺”为主要特征的并购推动下,资本市场中商誉规模快速扩大,商誉减值风险也随之扩大。部分上市公司商誉减值测试过程未能严格遵循准则要求,商誉减值受管理层主观因素影响大。很大一部分企业甚至将商誉减值作为盈余管理的工具,按管理层意愿调节当期业绩;也有企业在并购业绩承诺结束当年就直接计提巨
学位
突发疫情对人类健康、经济发展、社会秩序等造成严重损失,信息公开发布涉及地方政府部门、医疗专家、社会公众等多个不同主体,是突发疫情防控的关键环节。本文围绕疫情信息治理,研究了地方政府部门内部的疫情信息传播以及地方政府部门与医疗专家之间多渠道信息发布两部分内容。第一,根据疫情信息治理的职责与目标,将地方政府部门划分为卫生专业部门和行政管理部门并建立演化博弈模型,论证了在上级政府惩罚和媒体报道同时存在的
学位
改革开放以来我国经济飞速增长,在各个领域中都取得了举世瞩目的成就,人均GDP连续两年突破了 1万美元,但与此同时我国经济目前也暴露出不少的问题,如产业结构不均衡,城乡收入差距大,生态破坏较严重,资源配置效率低下,以上各种发展不协调、不充分、不可持续、效率低下的问题都对人们的生活产生了负面效应,也阻碍了我国经济的进一步发展。目前,我国已经不再只追求经济增长速度,更要追求经济增长的质量。本文中,经济增
学位
互联网快速发展带来了新的商业模式O2O(Online to Offline),其中外卖业务对人们的生活产生巨大影响。然而,多年来粗放型经营的弊端在逐渐放缓的增速中逐渐展现出来,亟需通过数据驱动的手段对外卖行业数字化升级,而商家在外卖行业中扮演着重要角色,其经营状况与服务质量关系到全行业发展。与传统企业相比,外卖商家订单需求不确定性更强,如果不能根据销售情况制定购买原料的计划,将产生库存成本或者损失
学位
制造业是国家经济的骨骼,是国民财富积累、科学技术创新的基础。自从改革开放以来,我国工业企业迅速发展,是全球唯一在联合国产业分类中,拥有全部分类的国家,到2020年为止,我国已有220多种工业产品,工业增加值已达31.3万亿元。近年来,随着经济的高速发展,工业企业的一些问题也随之突显,以前的“中国制造”的模式已经无法满足市场的需求,在追求经济高质量发展的前提下,如何寻求全新的工业化发展模式成为人们关
学位
近年来,随着我国“走出去”政策的持续推进和对“一带一路”倡议的大强烈响应,中国的对外直接投资水平得到了极大地促进,我国经济迅速发展。然而,随着投资额存量与流量的不断增大,中国经济也面临着要素资源、环境保护等多方面压力,曾经低成本、低效率的粗放型经济增长方式已不再适应当前的经济局势,而由其导致的资源错配问题,是限制我国生产率和产量的很主要因素。因此,对资源配置问题进行关注、分析与改善,成为了实现我国
学位
近十年来,金融科技的地位在全球金融市场日益凸显,金融科技公司如雨后春笋般迅速兴起。随着金融科技的迅猛发展,传统银行业不可避免的受到了金融科技的影响,蓬勃发展的金融科技打破金融市场时间、地域和交易方式的限制,促使传统商业银行形成新的竞争格局,同时对银行风险造成深刻的影响。金融科技对传统商业银行风险的影响可以从两方面体现出来。一方面,银行采用金融科技技术,例如大数据,区块链,机器学习等,提高自身风险管
学位
移动互联网的高速发展在4G、5G时代体现出了极强的适应性,为人们日常生活水平的提高提供了强有力的技术加持。在旅游业中,各大旅游网站通过采集吃住行相关的兴趣点信息供用户预订选择,用户在此信息网络中可以充分利用各种数据为出行提供决策依据,但不可避免的也有由于数据量过于庞大而导致用户无法高效选择的问题。推荐系统在众多商业领域展现出其显著的高效优势,但在旅游业的应用还有待研究和拓展。近年来,越来越多的用户
学位