论文部分内容阅读
对于传统零售业来说,销售是决定其能否成功的要素之一。近年互联网的疾速发展使得销售数据规模和种类急剧增长,依靠传统的人为分析海量销售数据从而决策的方式越来越无法满足企业的高效率要求,将销售数据分析与数据挖掘进行结合成为必然。因此,本文针对连锁超市的销售提出了销售异常发现与定位模型和销售预测模型,并在Hadoop云计算平台的Spark分布式处理框架下实现模型,最后设计开发原型系统展示相关数据和结果,为企业的高效决策提供了数据支持。销售数据由于受到节假日等因素影响而在一定程度上不具备可比性,采用传统异常检测方法的检测结果并不理想。对于连锁超市而言,检测异常和定位异常,实现责任到人都是其重要需求,因此针对销售数据的异常发现与定位方法成为一大难题。于是本文提出了异常发现与定位模型,模型首先根据连锁超市的管理模式将数据划分为四个层次,然后将每个层次的原始销售数据曲线转换为权重曲线使得数据具有一定程度的可比性,再进行异常发现并通过建立概率模型实现异常定位,最终实现责任到人。该模型在异常定位方面具有创新性,另外结合步步高连锁超市历史销售数据,该模型在检测异常的正确率和召回率方面也具有一定优势。无论企业规模大小,销售预测对其物流、库存、营销、财务等方面的影响都极其重大,但随着大数据时代的来临,基于传统数据库技术和经验的销售预测方法显然难以满足企业的需求。于是本文提出了基于传统销售预测理论与数据挖掘技术的销售预测模型,另外考虑到节假日对销售产生的影响,该模型还对普通节假日大量消费现象和春节提前释放消费能力的现象也进行了相应处理以提高预测准确性。在步步高2017年销售预测中,相比于移动平均法,本文销售预测模型在平均百分比误差上具有一定的优越性。利用信息化技术让销售数据和模型处理结果以原型系统的方式实现可视化,让企业对相关销售状况能够一目了然并在此基础上实现高效决策。