论文部分内容阅读
随着人们生活水平的不断提升,人们对冰箱的需求逐渐发生变化,冰箱产业也开启了新一代智能化改革,因此合理预测市场需求并依此对厂商物料采购、生产计划、市场规划等进行决策就非常重要。然而目前关于冰箱销量预测的研究却很少,仅有的研究大多都采用传统的灰色网络或时间序列模型进行预测,特征选取较宽泛,预测结果精度不高,无法满足现代化企业快速变化的发展需求。随着互联网时代的日益成熟,搜索引擎跟每个人的生活紧密联系,基于搜索指数的预测研究在多个领域被应用并取得不错的效果;另外,随着电商的兴起,使网上购物也成为一种主流的消费方式,网购产生的大量在线评论成为人们购买商品的重要依据之一。综上,本文以冰箱为研究对象,以包含百度指数及情感指数的网络搜索数据为基础,基于四种特征选择方法筛选出对冰箱销量影响最优的特征子集,并构建多种机器学习算法模型预测月度冰箱销量。本文研究内容主要包括以下方面:(1)基于消费者购买决策理论分析消费者在购买冰箱时的决策行为,提出包含百度指数及情感指数的网络搜索数据,并构建网络搜索数据与冰箱销量的关联框架模型,从理论上分析网络搜索数据对冰箱销量的预测能力;(2)分别获取网络搜索数据中的百度指数及情感指数并验证两者与冰箱销量的相关关系,为后文的预测研究奠定了数据基础;(3)基于传统的Wrapper启发式方法及本文提出的自适应遗传算法,将不同的机器学习算法作为基模型对网络搜索数据进行特征选择,筛选出对冰箱销量预测影响最优的特征子集,为后续建立模型做好准备工作;(4)基于传统的时间序列模型及随机森林和支持向量机两种机器学习算法,结合四组特征子集,同时以特征子集中是否包含情感指数为对比,共建立17组冰箱销量预测模型,比较分析不同模型的预测能力。结果表明,将随机森林作为基模型的自适应遗传算法进行特征选择得到的特征子集整体表现最好,且基于随机森林构建的预测模型各类指标评价更优,最小误差率MAPE为2.33%,较前人研究最优结果5.2%[73]提高了2.87%。