基于表达学习的用户购物行为分析及预测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:siquan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代的背景下,线上的电子商务公司,以及传统的线下购物企业均积累了海量的交易数据,为用户购物行为分析提供了数据基础。用户购物分析有助于刻画用户的人口特征属性、以及进一步捕获消费者的购物意图,从而帮助商家进行市场分析、调整销售策略、以及提供个性化推荐等。在满足消费者购物的同时,商家亦能提升自己的市场竞争力。但是面对交易信息的爆炸式增长,以及消费者日益增多的购物需求,如何准确地进行用户购物行为分析,广泛引起了人们的关注。  现今用户购物行为分析的研究存在一些不足。一方面,对用户购物行为预测的一个先决条件是理解用户,即用户人口特征属性的推断,但在购物场景下鲜有针对用户人口属性推断的研究,且相关领域的研究往往用人工定义特征的方式,耗时耗力,且定义的特征往往不一定适合最终的任务;另一方面,用户的购物受多个因素共同决定,建模这些因素之间的复杂交互很关键,但已有研究往往忽略多个因素之间的复杂交互,例如忽略短期兴趣或长期兴趣的交互,以及忽略用户兴趣和商品属性的动态变化等。针对已有研究的不足,本文提出了以下基于表达学习的用户购物行为分析及预测框架,通过基于表达学习的购物场景下的用户人口属性推断来自动学习用户的表达,以及建立了基于逻辑时间的购物篮预测和基于连续时间的购物篮预测模型,弥补了已有研究的缺陷。具体地:  第一,用户人口特征属性推断。本文设计了一个基于表达学习的、结构化用户人口特征属性的分类模型。具体的,我们模型一方面用表达学习的方式自动学习用户的特征,一方面结构化用户的画像分类任务,显式的学习用户的人口特征之间的关系。模型用监督学习的方式指导用户表达的学习。实验结果表明了该模型相对于传统人口特征属性推断算法的优越性。  第二,基于逻辑时间的购物篮预测。我们首先考虑了逻辑时间对于用户购物行为的影响,即通过建模用户交易的逻辑顺序来预测用户的购物。针对用户的购物行为,本文提出了层次化表达学习模型,通过融合用户的顺序行为和用户购物的长期兴趣,完成对用户的下一笔交易进行预测。我们的模型可以在不同的层次采用不同的操作算子来灵活的实现不同因素的融合,并具体分析了我们的模型和其他推荐算法之间的关系。最后我们在三个真实的数据集上验证了模型的有效性。  第三,基于连续时间的购物篮预测。传统的预测方法往往假设用户的兴趣和商品的属性是静态的。这个假设和现实的环境不符。用户的购物兴趣,以及商品本身的属性是随时间动态变化的。本文我们将基于连续时间的用户购物行为分析任务转化成动态表达的学习问题,在考虑连续的时间对用户兴趣和商品属性的影响后,我们提出了基于动态表达的时序预测模型来预测用户的购物行为。实验中我们在两个数据集上验证了模型的有效性。  综上所述,针对用户购物这一特殊的场景,本文提出了基于表达学习的用户购物行为分析及预测的框架。我们首先利用表达学习的方式对用户的画像特征进行预测,之后利用交易记录的顺序特征,对用户的购物进行预测,最后引入时间因素进一步提升预测的性能。
其他文献
随着云计算和多核/众核架构的飞速发展,数据中心中的资源利用率成为亟待解决的一个重要问题,当前数据中心资源利用率非常低的原因在于:由于资源竞争导致的性能干扰普遍存在,为了
无标记的3D人体运动捕获技术一直是计算机图形学与计算机视觉领域的研究热点,其成果被广泛应用于影视制作、游戏娱乐、训练仿真、医疗康复、安全预演等多个领域。但是,目前最好
随着移动通信系统的快速演进,其空中接口的物理层信号处理技术不断更新,物理层信号处理对算法灵活性和处理器计算能力的要求推动了信号处理软硬件的联合发展。在硬件上,专用于通
USB接口技术使得外设具备了即插即用和热插拔等特性.根据传统磁盘阵列的特性,选用了NETCHIP2270外设接口芯片,构造了一个廉价的USB—EIDE协议变换的磁盘阵列.通过编写磁盘阵
论文以某国防预研项目《高性能适应分布实时计算系统技术》为背景,结合了国内外相关技术的前沿发展,深入研究了一种适应的分布资源管理技术的设计思想和实现方法。 动态分布
近年来,关于Agent和多Agent系统(MAS)的理论、技术和应用研究,在学术界和工业界都已经成为热门的课题。由于单个Agent不足以完成全部的问题求解,所以需要多个Agent一起通过协商
数字水印技术是信息伪装中的一个重要内容,它作为数字媒体版权保护的有效手段得到了广泛关注,迅速成为国际学术界一个研究热点。基于人类视觉系统的数字水印版权保护技术必须
随着对多Agent系统研究的逐步深入,以及基于多Agent技术的应用系统不断出现,Agent及多Agent系统安全性日前成为一个重要的研究课题.该文的主要工作就是在分析了多Agent系统可
网络附加储通过网络为各种平台的用户提供文件服务,它功能专一、即插即用、易于管理,而且其效率比传统的文件服务器高.从存储体系结构看,NAS是一个文件层的存储设备.通常内置
该文探讨了选择运算的实现方法,这种方法相比较基于索引的选择算法,能够减少由于读取索引块引起的磁盘访问开销;基于数据仓库中维表的数据量远远小于事实表的数据量这一特点,