论文部分内容阅读
近年来,020(线上到线下)外卖行业迅速发展,依靠大量投钱推广的时代已然过去,一些问题逐渐显露。当前行业中存在着用户满意度低、物流成本高、配送效率低等问题亟待解决。这些现实问题想要得到解决,一个很重要的方面就是利用好平台积累的大量历史数据,发现其中的规律,进而运用规律,辅助决策。本研究从这一角度入手,基于某外卖平台的历史数据,探索订单到达的时间分布规律,研究顾客需求的预测方法,帮助企业预估需求量。准确预测顾客的需求可以使企业可以提前做好准备,实现人力物力的合理配置,这对于提高外卖配送效率、降低物流成本最终提高经济效益是很有必要的。因此,本文着重解决的两大问题是:订单到达时间分布规律的探索和数据驱动的顾客需求建模。围绕这两个问题,本文的主要工作和结论包括:(1)对历史数据进行描述性统计分析,发现外卖订单中蕴含的统计规律,外卖订单在空间中的分布情况呈现出在学校、医院、大型商业街附近订单密集程度高的特点。需求量与节假日和天气有一定关系,周末的订单量相对工作日通常略低一些,法定节假日期间订单量会出现明显的下降;当出现降水时,外卖需求量通常会有一定的提升。(2)基于已有历史数据得出了 020外卖订单到达时间分布的规律,外卖平台一天中的订单量分布情况是午、晚两餐各出现一个近似高斯分布的波峰。近似拟合结果为两个高斯分布的加和,单独提取午间高峰期依然是两个高斯分布和的拟合结果最优,因此,外卖平台订单到达的分布可近似看作两个高斯分布加和的形式。这一规律对于外卖企业来说,可以用来监控平台的运营状况,判断每日的经营状态是否出现异常,也可用作短期的订单量预判。(3)发现有助于顾客需求预测的变量并通过实验验证变量的有效性。参考现有文献和直观推测并通过实验验证,得出节假日、降水情况、前n日均值和月末分布这几个变量在外卖需求预测中是有效的。目前020外卖需求预测的研究非常稀少,本文提出的变量不仅对于现实外卖平台的决策大有助益,同时也为领域内其他学者日后的研究提供了参考。(4)建立SARIMA-SVR组合预测模型,根据历史订单数据预测未来一个月每天中午高峰时段的订单量,很好地拟合了数据中的线性成分和非线性成分。对比经典与常用的SARIMA模型、神经网络、决策树以及线性回归模型准确度更高。其中一些模型虽然以往在其他领域的预测中已有应用,但在外卖预测领域的使用效果几乎没有人验证过,本文的对比实验结果可以作为后续研究的基准。对于现实020外卖企业来说,该方法有助于020外卖平台进行最合理的资源配置,提前调配好人力物力、减少服务时间、提升顾客满意度等,同时也可以为020平台提供预测方法与数据的支撑。