论文部分内容阅读
随着零售企业的发展和数字化转型,中国的零售市场正在迎来新的变革。零售市场不确定性的增强以及市场环境的多变,对零售商尤其是大型零售商而言,及时的针对市场的不确定性变化,制定或调整管理及运营决策变得更加不易。同时,大型零售企业通过长期线上线下的积累,拥有了大量的数据资源,包括交易数据、商品数据、消费者数据和消费场景数据等等。随着消费者消费行为的逐渐变化、零售商品种类的日益丰富和消费场景的不断升级,零售企业积累的这些数据资源也更加复杂。由于市场的多变、数据体量的增大和内容的复杂,传统的企业运营完全依靠简单的人工分析数据制定运营决策的方式已经不能准确及时的应对企业需要。因此,基于复杂的多维零售大数据集,对数据驱动运营决策过程建模,辅助决策者快速制定或调整决策,具有一定得必要性和可行性。目前,国内外学者对于零售运营的研究大部分都是研究预测和数据挖掘,对异常,也就是实际情况与预期、计划和习惯不符合的状况的发生的研究较少。同时,异常分析也是从数据中抽取知识的一种形式,通过分析异常找到异常原因进而快速的调整决策达到决策支持得目的,也是实现数据驱动决策的另一种形式。因此本文基于零售多维大数据集,对零售系统运营过程,即数据驱动决策过程进行建模,研究了运营异常的识别方法,然后对异常分析原因。
首先,本文在国内外相关文献研究的基础上,对零售系统的运营过程,即数据驱动决策的过程进行知识表达。本文对从数据中发现能够支持运营决策的有效的、隐含的、有实际意义的知识的运营系统进行符号表达,并根据运营异常的表现形式不同,从高到低分别定义了零售系统的低、中、高三阶异常。并仅针对无特定规律的低阶异常进行了研究,从销售差异的显著性的角度来表现运营异常,并且在零售多维数据集内部定义了异常原因。然后本文基于已经定义的零售系统运营异常,提出了多粒度的运营异常识别方法。考虑到零售多维数据集的时间序列特性,改进基于密度的异常因子LOF检测方法,构建检测时间序列分割后的子序列模式异常的模型。从多粒度的角度构建异常识别算法,并以某大型服装零售企业的真实样本验证方法的可行性和有效性。最后,笔者在已识别的异常基础上,基于改进的灰色斜率关联度模型,构造多层次属性迭代的异常原因分析算法。用销售结构差异时序数据波动对异常销量差异时序数据波动的关联度来表示异常原因的影响程度。通过分析,得到具有层次结构的最大可能性原因集合,并用零售企业真实数据对模型与算法进行了验证,根据异常和异常原因的实验结果对企业销售决策提出改进建议。
本文在现有的异常识别和原因分析方法的基础上进行改进,提出了基于多维数据集的零售运营异常识别模型与算法,进行了方法和应用创新,对整个零售行业具有一定的通用性,具有一定的理论意义和实际意义。
首先,本文在国内外相关文献研究的基础上,对零售系统的运营过程,即数据驱动决策的过程进行知识表达。本文对从数据中发现能够支持运营决策的有效的、隐含的、有实际意义的知识的运营系统进行符号表达,并根据运营异常的表现形式不同,从高到低分别定义了零售系统的低、中、高三阶异常。并仅针对无特定规律的低阶异常进行了研究,从销售差异的显著性的角度来表现运营异常,并且在零售多维数据集内部定义了异常原因。然后本文基于已经定义的零售系统运营异常,提出了多粒度的运营异常识别方法。考虑到零售多维数据集的时间序列特性,改进基于密度的异常因子LOF检测方法,构建检测时间序列分割后的子序列模式异常的模型。从多粒度的角度构建异常识别算法,并以某大型服装零售企业的真实样本验证方法的可行性和有效性。最后,笔者在已识别的异常基础上,基于改进的灰色斜率关联度模型,构造多层次属性迭代的异常原因分析算法。用销售结构差异时序数据波动对异常销量差异时序数据波动的关联度来表示异常原因的影响程度。通过分析,得到具有层次结构的最大可能性原因集合,并用零售企业真实数据对模型与算法进行了验证,根据异常和异常原因的实验结果对企业销售决策提出改进建议。
本文在现有的异常识别和原因分析方法的基础上进行改进,提出了基于多维数据集的零售运营异常识别模型与算法,进行了方法和应用创新,对整个零售行业具有一定的通用性,具有一定的理论意义和实际意义。