论文部分内容阅读
在大数据时代的背景下,线上的电子商务公司,以及传统的线下购物企业均积累了海量的交易数据,为用户购物行为分析提供了数据基础。用户购物分析有助于刻画用户的人口特征属性、以及进一步捕获消费者的购物意图,从而帮助商家进行市场分析、调整销售策略、以及提供个性化推荐等。在满足消费者购物的同时,商家亦能提升自己的市场竞争力。但是面对交易信息的爆炸式增长,以及消费者日益增多的购物需求,如何准确地进行用户购物行为分析,广泛引起了人们的关注。 现今用户购物行为分析的研究存在一些不足。一方面,对用户购物行为预测的一个先决条件是理解用户,即用户人口特征属性的推断,但在购物场景下鲜有针对用户人口属性推断的研究,且相关领域的研究往往用人工定义特征的方式,耗时耗力,且定义的特征往往不一定适合最终的任务;另一方面,用户的购物受多个因素共同决定,建模这些因素之间的复杂交互很关键,但已有研究往往忽略多个因素之间的复杂交互,例如忽略短期兴趣或长期兴趣的交互,以及忽略用户兴趣和商品属性的动态变化等。针对已有研究的不足,本文提出了以下基于表达学习的用户购物行为分析及预测框架,通过基于表达学习的购物场景下的用户人口属性推断来自动学习用户的表达,以及建立了基于逻辑时间的购物篮预测和基于连续时间的购物篮预测模型,弥补了已有研究的缺陷。具体地: 第一,用户人口特征属性推断。本文设计了一个基于表达学习的、结构化用户人口特征属性的分类模型。具体的,我们模型一方面用表达学习的方式自动学习用户的特征,一方面结构化用户的画像分类任务,显式的学习用户的人口特征之间的关系。模型用监督学习的方式指导用户表达的学习。实验结果表明了该模型相对于传统人口特征属性推断算法的优越性。 第二,基于逻辑时间的购物篮预测。我们首先考虑了逻辑时间对于用户购物行为的影响,即通过建模用户交易的逻辑顺序来预测用户的购物。针对用户的购物行为,本文提出了层次化表达学习模型,通过融合用户的顺序行为和用户购物的长期兴趣,完成对用户的下一笔交易进行预测。我们的模型可以在不同的层次采用不同的操作算子来灵活的实现不同因素的融合,并具体分析了我们的模型和其他推荐算法之间的关系。最后我们在三个真实的数据集上验证了模型的有效性。 第三,基于连续时间的购物篮预测。传统的预测方法往往假设用户的兴趣和商品的属性是静态的。这个假设和现实的环境不符。用户的购物兴趣,以及商品本身的属性是随时间动态变化的。本文我们将基于连续时间的用户购物行为分析任务转化成动态表达的学习问题,在考虑连续的时间对用户兴趣和商品属性的影响后,我们提出了基于动态表达的时序预测模型来预测用户的购物行为。实验中我们在两个数据集上验证了模型的有效性。 综上所述,针对用户购物这一特殊的场景,本文提出了基于表达学习的用户购物行为分析及预测的框架。我们首先利用表达学习的方式对用户的画像特征进行预测,之后利用交易记录的顺序特征,对用户的购物进行预测,最后引入时间因素进一步提升预测的性能。