论文部分内容阅读
随着互联网的高效普及和消费的不断升级,线上消费市场迸发新活力,实现了消费的全面提速与新业态的不断涌现。各电商平台,例如淘宝、天猫、京东商城等在保持高速发展的同时,积累了数以亿计的用户。电商用户的快速增长给平台带来巨大经济效益的同时,也带来了新的问题,即平台各商家如何进行商品信息的有效投放和对用户的精准服务,以满足个性化、定制化的消费需求。因此,从电商平台健康发展和效益增速的角度出发,对用户购买行为进行预测是十分必要的。一方面可以掌握用户的购物需求为其提供更优体验,另一方面,为店铺提供了有效参考,助力其发展。本文依托京东商城真实的历史数据,利用数据挖掘技术与机器学习分类算法,建立用户购买预测模型,确定用户在未来一段时间内对指定品类店铺的购买意向。在模型建立的过程中,针对数据的时间特性,利用滑动窗口方法构造了多类特征,有效提升了模型的预测效能,在基于树模型的几个分类算法预测中,得出基于Light GBM算法的分类模型预测效果最佳。具体的研究工作如下:(1)问题分析与数据处理。将问题转化为一个二分类问题。对数据进行单变量分析与可视化,分析影响预测的主要因素,对数据进行针对性处理。(2)基于用户购买行为的特征研究。在特征处理的过程中,除了考虑初始特征,构造了品类、店铺、用户、品类-店铺、用户-品类、用户-店铺和用户-品类-店铺7类特征。结合相关性大小和XGBoost算法进行特征的选择,给出特征重要性排序,确定强相关的特征,提供了有效的特征信息。(3)分类模型的预测与评估。对数据集进行合理划分,选择基于树模型的算法进行模型的建立,分别基于XGBoost算法、Light GBM算法与随机森林算法对样本进行训练学习。根据评估指标F1对模型的预测效果进行评估对比。(4)基于预测结果的相关建议。为电商平台的推荐系统建设及店铺信息投放方案的设定等提出建议,具有一定的应用价值。