论文部分内容阅读
随着网络技术的迅速发展,电子商务逐渐成为人们日常生活中不可或缺的一部分。近年来,淘宝、京东等电子商务平台越来越受到用户的青睐。在购物网站上,只需要通过浏览、收藏、加购物车和购买等简单的几步操作,用户就能挑选出感兴趣的商品。电商平台在用户购物的过程中记录了用户与商品的交互行为,这些行为记录虽然包含丰富的用户兴趣信息,但是并不能直观地表达用户对商品的偏好程度,存在用户兴趣信息提取困难的问题,从而导致数据的价值没有得到充分的利用。针对这个问题,本文围绕挖掘行为记录中包含的隐式兴趣信息这一目标,针对具体应用场景中的数据特性,从行为和序列两个方面充分分析,深入挖掘兴趣信息,构建有效的兴趣模型。本文依据行为记录的时间属性提取行为序列,根据交互商品序列的上下文关联性对商品进行向量表示,提取行为特征和序列特征预测用户兴趣商品,根据预测结果构建用户兴趣模型,具体研究内容如下:(1)商品向量化表示,根据交互商品序列的上下文关联性特点,使用item2vec算法学习得到商品的隐向量表示,使得向量空间能够表达更加丰富的商品关联性信息,通过聚类形成商品簇,每个商品簇作为一个粗粒度兴趣,在粗粒度上构建兴趣模型。(2)兴趣商品预测,分析历史行为记录与用户兴趣商品之间的关系,根据经验提取行为特征,使用RNN(Recurrent Neural Network)提取序列特征,建立预测模型,得到每个用户的兴趣商品集合和用户对商品的兴趣度,通过模型优化提升预测效果。(3)构建兴趣模型,根据商品向量空间、粗粒度兴趣点、兴趣商品集合刻画用户兴趣,提出用户兴趣计算方法,对用户偏好做形式化描述,提供个性化推荐的依据。(4)实验验证与分析,在真实数据集上验证本文各部分算法的有效性,通过对比实验调整模型到最优状态,并分析模型的优缺点。