论文部分内容阅读
可靠的销售额预测能够帮助商场管理者建立有效的员工日程安排,并帮助商场管理者发现影响客户和团队的重要因素,从而改进生产模式,提高商场的赢利能力。本论文以德国著名实体零售业Rossmanns公司1115家分店的日常销售数据及店铺信息数据为挖掘对象,采用探索性数据分析及可视化技术,使用Python和R语言编程实现,对比了Xgboost(Extreme Gradient Boosting)、随机森林、GLMNET(Lasso and Elastic-Net Regularized Generalized Linear Models)以及LM(Linear Model)、TSLM(Time Series Linear Model)模型在销售额预测上的性能,初步发现Xgboost方法在RMSPE(Root Mean Square Percentage Error)评价标准上取得较好的效果。为进一步提高Xgboost方法的销售额预测精度和泛化性能,论文结合特征工程,采用集成学习方法,利用GLMNET和Xgboost模型拟合残差,结合LM、TSLM在趋势和季节性预测的优点,建立Xgboost组合模型,并通过参数调优提高其性能。通过实验证明,得到的最终组合模型可提高销售额预测的精度和泛化能力。基于Xgboost的组合模型不仅适用于对德国零售业销售额的预测,还可以将此方法应用于国内零售实体业甚至电商平台的销售额预测,对于提高商店的运营模式、商品的价格、配货方式及针对性的精准销售具有重要的意义。