基于改进随机森林的卷烟订购量预测的研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:wewe11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
烟草“新零售”跟随时代的脚步应运而生,预测卷烟订购量帮助生产商进行科学的原料储备、生产和营销等运营活动,帮助零售户方便地订购各品类、价类卷烟数量,提高资金利用率,提升店铺盈利水平。本文所做的主要工作如下:(1)本文基于两大类集成学习方法训练了卷烟订购量预测模型。分析得出影响卷烟订购量的因素分为自身因素,环境因素,时间因素三个大类,通过数据接口获取江西烟草生态新零售系统提供的卷烟相关数据,通过江西省统计年鉴公开数据获得环境相关数据,经过特征分析、数据清洗整理得到原始数据集,然后利用随机森林度量各个特征变量的重要性,选择重要性较高的特征生成新的数据集,在原始数据集和新数据集基础上分别训练了用于预测卷烟订购量的随机森林模型、GBDT模型和Adaboost-CART模型,实验对比的结果表明,在新数据集的基础上训练出来的随机森林预测模型综合性能更好。(2)为了进一步提高基于随机森林的卷烟订购量预测模型的预测准确率,采用k-means对数据集簇类集合,再对各个集合分别进行bootstrap抽样、整合,以获得数据平衡的基学习器训练样本。然后,对随机森林最后结果是对所有基学习器的输出取均值的方法,采用加权平均值的方法进行了优化,依据基学习器袋外数据的MAPE推导得到权重公式,计算后得到加权随机森林预测模型。从预测精度和训练速度两方面来分析模型的改进效果,结果表明,加权随机森林模型的预测准确率得到了明显的提高,综合性能更好。(3)设计并实现了江西烟草数据统计系统。系统采用了微服务架构模式,实现了对零售户日常销售数据的监测,对零售户、消费者各项相关数据做了各种场景的统计展示,对零售户下期卷烟订购量进行预测,对用户进行权限管理。系统帮助生产商了解卷烟市场情况,帮助零售户了解店铺经营情况和对卷烟一键订货,能够广泛应用于生产经营中。
其他文献
目的探讨常规超声对胰腺浆液性囊腺瘤(serous cystadenomas,SCAs)的诊断价值。方法将2005年1月-2015年12月我院外科手术病理证实的39例胰腺浆液性囊腺瘤按照病理表现分为微囊型
目的研究布地奈德混悬液联合复方异丙托溴铵对慢性阻塞性肺疾病急性加重期(acute exacerbation of chronic obstructive pulmonary disease,AECOPD)疗效。方法选取我院2016年4
目的从美国引入老年人跌倒风险自评量表(Self-rated Fall Risk Questionnaire)形成相应的中文版,以期为我国老年人跌倒风险评估提供有效工具。方法英文版量表经过翻译和文化
<正>如果我们把古代丝绸之路称之为全球化1.0时代,近代西方开创的全球化称之为全球化2.0时代,那么,&#39;一带一路&#39;倡议则开创了全球化3.0时代:秉承&#39;万物互联&#39;,运
期刊
目的观察普拉洛芬联合玻璃老年酸钠治疗老年糖尿病白内障术后干眼症的临床疗效。方法将徐州第三人民医院眼科2016年1月-2018年1月收治的120例老年糖尿病白内障术后干眼症患者