论文部分内容阅读
在线广告是互联网中最具利润的商业模式,展示广告尤其是担保式广告(Guaranteed Display Advertising-GD)作为在线广告的一种,在学术界和工业界受到了广泛的关注。在担保式广告中,广告平台与广告主达成协议,如果在规定的时间内达到了一定的投放量和投放效果,广告主会向广告平台支付相应的费用;如果未达到预期效果,则会要求广告平台给予相应的赔偿。访问量预测作为展示广告中至关重要的一个环节,其预测的精确性将直接影响广告平台的收益。广告平台的访问量预测是利用历史的访问量数据来对未来的访问量进行分析和预测,如果访问量预测的过多,则会给广告平台带来违约并导致赔偿的风险;如果访问量预测的过少,会导致流量的浪费并降低广告平台的收益。所以,如何准确的分析历史访问量数据并做出精确的预测,成为了一个亟待解决的问题。论文针对上述问题,从时间序列数据分析的角度对广告平台的访问量预测算法进行了研究,论文主要包括以下几方面内容。运用ARIMA和Holt-Winters两种典型时间序列预测模型对广告平台访问量进行预测,由于Holt-Winters季节模型分为乘性和加性两种,论文对这三种模型的预测效果进行了对比分析。实验结果表明ARIMA模型和乘性Holt-Winters季节模型在广告访问量预测上的效果要优于加性Holt-Winters季节模型,同时ARIMA模型和乘性Holt-Winters季节模型有各自的适用场景,ARIMA模型对周期性不明显的时间序列有更好的表现,乘性Holt-Winters季节模型对周期性明显的时间序列效果更好。为了提升访问量预测的精确度和处理时间序列数据中的异常点,本文使用传统滤波算法对时间序列进行预处理,传统滤波算法包括快速傅里叶变换频域滤波、均值滤波、高斯滤波,实验结果表明传统滤波算法对于广告访问量的异常点处理效果不好,本文针对该问题提出了一种基于流量拆分的滑动窗口滤波算法,并与传统滤波算法进行比较,结果表明对于广告访问量数据的平滑策略,本文提出的滤波算法对预测效果的提升较为明显。