论文部分内容阅读
随着移动互联网的飞速发展,运用手机等设备在网上订购酒店的方式日益受到了消费者的喜爱。如何利用订购平台上积累的海量数据对各酒店在未来一段时间的线上销量进行预测是平台进行收益管理与平台管理的核心。然而,酒店的线上销量数据通常受到复杂的市场因素的影响,具有波动复杂,节假日效应明显的特点。传统的单一时序模型难以精准捕捉到酒店销量波动特性,且移植性较差。针对上述问题,本文提出了一种基于组合模型的酒店线上销量预测算法。该算法由两个模型组成,即基于残差拟合的非节假日酒店线上销量预测模型与基于Lasso的节假日酒店线上销量预测模型。在预测前,算法首先判断待预测时间段属于什么时期,并采用对应的模型进行预测。对于基于残差拟合的非节假日酒店线上销量预测模型,本文针对非节假日时期的酒店线上销量数据具有强周期性以及随机性的特点,设计并实现了基于残差拟合模型组合方法对非节假日时期的酒店销量进行预测。该方法使用FBProphet模型与LightGBM模型来分别预测酒店销量的规律项与随机项,并将两个模型的结果进行了结合以得到最终的预测结果。对于基于Lasso的节假日酒店线上销量预测模型,本文针对节假日时期的酒店线上销量数据具有爆发性的特点,对日期与节假日的相对关系、提前预定量以及历史销量分位数与节假日时期的线上销量之间的相关性进行了分析。并基于这些分析设计了相应的特征工程与模型。此外,还提出了异常酒店的检测与修正方法对销量异常的酒店进行检测并进行预测值修正。所提算法通过对不同时间阶段的销量预测任务分别建模的方式解决了单模型在酒店线上销量预测场景中可移植性差的问题。同时,算法中还包含了异常酒店的检测与修正方法,缓解了模型难以对异常酒店预测出可靠结果的问题。本文采用国内某知名订购平台的真实销量数据为实验数据,通过一系列实验证明了本文算法在节假日时期与非节假日时期的Mae性能均优于LightGBM、FBProphet等单模型的性能。