基于网络搜索数据的冰箱销量预测研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:huitianfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们生活水平的不断提升,人们对冰箱的需求逐渐发生变化,冰箱产业也开启了新一代智能化改革,因此合理预测市场需求并依此对厂商物料采购、生产计划、市场规划等进行决策就非常重要。然而目前关于冰箱销量预测的研究却很少,仅有的研究大多都采用传统的灰色网络或时间序列模型进行预测,特征选取较宽泛,预测结果精度不高,无法满足现代化企业快速变化的发展需求。随着互联网时代的日益成熟,搜索引擎跟每个人的生活紧密联系,基于搜索指数的预测研究在多个领域被应用并取得不错的效果;另外,随着电商的兴起,使网上购物也成为一种主流的消费方式,网购产生的大量在线评论成为人们购买商品的重要依据之一。综上,本文以冰箱为研究对象,以包含百度指数及情感指数的网络搜索数据为基础,基于四种特征选择方法筛选出对冰箱销量影响最优的特征子集,并构建多种机器学习算法模型预测月度冰箱销量。本文研究内容主要包括以下方面:(1)基于消费者购买决策理论分析消费者在购买冰箱时的决策行为,提出包含百度指数及情感指数的网络搜索数据,并构建网络搜索数据与冰箱销量的关联框架模型,从理论上分析网络搜索数据对冰箱销量的预测能力;(2)分别获取网络搜索数据中的百度指数及情感指数并验证两者与冰箱销量的相关关系,为后文的预测研究奠定了数据基础;(3)基于传统的Wrapper启发式方法及本文提出的自适应遗传算法,将不同的机器学习算法作为基模型对网络搜索数据进行特征选择,筛选出对冰箱销量预测影响最优的特征子集,为后续建立模型做好准备工作;(4)基于传统的时间序列模型及随机森林和支持向量机两种机器学习算法,结合四组特征子集,同时以特征子集中是否包含情感指数为对比,共建立17组冰箱销量预测模型,比较分析不同模型的预测能力。结果表明,将随机森林作为基模型的自适应遗传算法进行特征选择得到的特征子集整体表现最好,且基于随机森林构建的预测模型各类指标评价更优,最小误差率MAPE为2.33%,较前人研究最优结果5.2%[73]提高了2.87%。
其他文献
建筑电气设计中最为关键的部分主要在于低压的配电系统,这是建筑电气系统中十分重要的环节之一。而在当前我国建筑工程的设计与应用中,低压配电的设计和施工一旦不当,就容易
园林设计是一门结合多种学科的艺术,它不是一个简单的景观拼凑,需要结合很多相关的条件和实际的经验的,更何况现科:的社会发展迅速,园林设计也不例外,许多新的元素的假如对其更是要
高钛高炉渣是采用高炉冶炼高钛型钒钛磁铁矿而排放出的工业固体废弃物,具有只在我国攀西地区存在的地域特殊性,以及有价组分存在复杂、含量丰富的性质特殊性。高钛高炉渣产量
利用设计合成的特异性引物,通过PCR扩增获得乙肝病毒的S区621个bp DNA片段.该扩增产物经EcoRI与BamHI双酶切后直接克隆进入PSK载体进行表达,再通过扩增重组菌株,以获得大量的
清代外销银器主要是指鸦片战争前后一百年间销往欧美以及印度等地区的银器。该批银器一直散落海外,一度被历史尘封,直到上个世纪末,国人对这些银器知之甚少。早期的外销银器
金属纳米催化剂能够快速高效地处理多种水体污染,如重金属污染和水中有机物的去除。金属纳米催化剂的制备方法及制备过程的影响因素对催化剂的形貌和性能具有很大的影响,因此