论文部分内容阅读
摘要:数据挖掘可以从海量数据中提取有用的知识。本文针对来自零售业逆向物流系统的数据数量大且更新速度快的特点,运用统计分析方法,研究数据挖掘在这一领域的具体应用,为零售企业提供了一种在产品质量上对供应商进行评估的方法。
关键词:数据挖掘;逆向物流;供应商评估
中图分类号:F715文献标识码:A文章编号:1002-3100(2007)09-0110-03
Abstract: By data mining, we may acquire some useful knowledge from large amounts of data. There is plenty of data in the reverse logistics system of retail industry, and it updates frequently. Based on the two characteristics, the authors make a research on the concrete application of Data Mining in this field with the method of statistics, and further provide a method of supplier evaluation about the quality of goods for retail enterprises.
Key words: data mining; reverse logistics; supplier evaluation
数据挖掘又被称为数据库中的知识发现(Knowledge Discovery from Database,KDD)[1]或探测性的数据分析,它是一个从大量的、冗余的、有噪声的甚至缺损的数据中提取有用知识的复杂过程。根据《物流术语》(2001),逆向物流可分为两大类:回收物流和废弃物物流[2]。零售行业的顾客驱动特征比较明显,因顾客退货、零售企业日常管理等原因产生的回收物流比例较大。这类逆向物流数据来自生产实践环节,不但数量大,而且更新速度快,为运用统计分析方法进行数据挖掘带来了便利。
1研究零售业逆向物流的意义
1.1零售业逆向物流。零售业逆向物流具有流动对象数量大、种类多及物流业务频繁等特点。在因顾客退货、零售企业日常管理等原因产生的回收物流中,大量的退货不但占用了巨额的流动资金,而且耗费了物流管理层的大量时间和精力,增加了企业的营销成本。这些退货中,零售企业通过加强管理,可将来源于自身的那部分退货比例控制在可接受的水平。因此,管理者更关心的是如何减少顾客的退货行为,降低退货数量。
1.2顾客退货行为。顾客满意度是预测顾客行为的可靠指标[3]。在这里,我们把零售行业顾客采取退货行为的原因分为满意度不够和无条件退货两类。无条件退货即顾客退货的原因无法确定,对这类退货进行分析较为困难。而顾客满意度不够,通常显性地表现为对商品质量或服务质量的抱怨。
顾客行为也可通过忠诚度、支付更多、转移行为、内部反应和外部反应等5个变量来进行测评[3]。对零售商而言,当顾客对商品质量或服务质量不满意时,其忠诚度会下降,支付更多的可能性会降低,转移行为增多,内部反应表现出向本零售企业抱怨、要求赔偿等,外部反应则表现为负面宣传、通过第三方进行交涉等。因此,退货行为在降低该商品的品牌声誉的同时,也给零售商带来了不利影响。
在基于客户订货(Build To Order, BTO)的生产模式下,零售企业对供应商有着显著的影响力。因此,利用这些来自逆向物流信息系统的退货数据,零售企业可定期地在产品质量上对供应商进行评估,为相关决策提供依据。
1.3产品质量与供应商评估。在供应链管理中,价格、质量、交货提前期、服务水准等4个因素是对供应商进行评估的关键因素[4]。质量是评价供应商的基本指标之一,是指供应商的产品满足企业需求的程度。客户企业对产品注重的是整体质量,次品过多可能直接导致客户企业无法按计划运营,而少量产品质量过高只会增加供应商的成本[5]。因此,每一个零售企业都应建立自己的质量标准,产品质量符合双方的约定即可。在这里,质量标准用每100件产品中的破损数量值即次品率来表征。通过对逆向物流数据进行数据挖掘,可提取包括次品率在内的很多新信息。这些知识既可用自身选择供应商的决策,也可反馈给供应商以改进产品质量,增强本供应链的竞争力。
2零售业逆向物流中的数据挖掘应用
2.1.2基于成对数据的t检验法。基于成对数据的t检验用于对2个供应商进行评估,判断其中一个的供货质量是否有显著的优势。选用这一方法的原因在于:这里讨论的样本均由历史数据组成。在不同时期,原材料价格、供需关系等市场条件是不同的。反之,同一时期来自不同供应商的次品率数据是在相似条件下出现的,可认为是成对的。
依次进行上述3种假设检验方法,可了解某种商品中不同供应商的供货质量情况,为选择和评估供应商提供依据。
2.2数据挖掘过程。零售业逆向物流的退货数据部分来自顾客因质量缺陷的退货,部分来自顾客无条件退货,还有的来自零售企业自身的经营活动。为了准确地反映某种商品的次品率,与销售量对应,在逆向物流数据中只选择来自顾客因质量缺陷的这部分退货数据。两者的比值即为该商品的次品率。这样做排除了零售商自身业务活动的干扰,在顾客足够理性的前提下,影响产品质量的因素只剩下一个即供应商,下面对某种商品供货质量进行的统计分析就成为单因素分析。数据挖掘步骤见图1。
在图1中,对来自各供应商的次品率数据进行方差分析后,若发现数据间存在明显差异,下一步就进行成对t检验;否则,可认为不需要对该种商品的各类别进行比较,下一步直接进行单个类别的t检验。因此,通过这一数据挖掘过程,无论该种商品有多个供应商,还是只有一个,都可得到相应的评估结果。
2.3数据挖掘实例
2.3.1数据准备。首先进行数据准备,将所需的各个商店前端设备(POS、扫描仪)采集来的原始销售数据和逆向物流信息系统采集来的退货数据纳入挖掘数据库。原始销售数据表用来统计指定商品的销售量,逆向物流数据表则用来统计指定商品的退货数量。这里按评估的时间周期对这些数据分类,那么在不同评估周期内,具有不同的销售量和退货量,求得的次品率也不相同。
2.3.3结果分析。上述实例中首先由方差分析法得到来自3个供应商的次品率显著不同的结论;然后用成对数据的t检验法对这3类次品率进行两两比较,找出差异明显的类别;最后以规定标准为依据,对各商品类进行逐一判断。通过这一挖掘过程,完成了对该种商品的全部3个供应商的评估,结论为:01类供应商异常,表现为供货质量明显优于02类;02类供应商异常,表现为供货质量明显劣于01类且明显劣于规定标准;其余供应商为正常状态。
3结束语
数据挖掘技术在零售业逆向物流领域具有广泛的应用前景,如通过收集商品退货信息,可了解产品的真实销售情况,对市场变化做出快速反应;通过收集逆向物流信息,可了解顾客对商品的外观或功能建议,与上级供应链成员共享信息,优化整个供应链。本文提出的统计分析方法用于在产品质量上对供应商进行评估。为减少干扰,可适当增大样本容量,灵活设置显著性水平α的值,以提高数据挖掘的有效性。
参考文献:
[1] 朱明. 数据挖掘[M]. 合肥:中国科学技术大学出版社,2002.
[2] 鄢飞. 广义逆向物流浅析[J]. 西安财经学院学报,2006(2):75-77.
[3] 刘耘. 电子企业消费者行为预测模型及应用[J]. 通信企业管理,2006(8):68-69.
[4] 孙朝苑,彭其渊. 利用多维灰度评估进行供应商的选择与评价[J]. 西南交通大学学报,2004,39(3):277-280.
[5] 何彤. 外资企业对供应商的评估要素[J]. 中国物流与采购,2005(15):58-59.
[6] 盛骤,谢式千,潘承毅. 概率论与数理统计[M]. 2版. 北京:高等教育出版社,1989.
“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”
关键词:数据挖掘;逆向物流;供应商评估
中图分类号:F715文献标识码:A文章编号:1002-3100(2007)09-0110-03
Abstract: By data mining, we may acquire some useful knowledge from large amounts of data. There is plenty of data in the reverse logistics system of retail industry, and it updates frequently. Based on the two characteristics, the authors make a research on the concrete application of Data Mining in this field with the method of statistics, and further provide a method of supplier evaluation about the quality of goods for retail enterprises.
Key words: data mining; reverse logistics; supplier evaluation
数据挖掘又被称为数据库中的知识发现(Knowledge Discovery from Database,KDD)[1]或探测性的数据分析,它是一个从大量的、冗余的、有噪声的甚至缺损的数据中提取有用知识的复杂过程。根据《物流术语》(2001),逆向物流可分为两大类:回收物流和废弃物物流[2]。零售行业的顾客驱动特征比较明显,因顾客退货、零售企业日常管理等原因产生的回收物流比例较大。这类逆向物流数据来自生产实践环节,不但数量大,而且更新速度快,为运用统计分析方法进行数据挖掘带来了便利。
1研究零售业逆向物流的意义
1.1零售业逆向物流。零售业逆向物流具有流动对象数量大、种类多及物流业务频繁等特点。在因顾客退货、零售企业日常管理等原因产生的回收物流中,大量的退货不但占用了巨额的流动资金,而且耗费了物流管理层的大量时间和精力,增加了企业的营销成本。这些退货中,零售企业通过加强管理,可将来源于自身的那部分退货比例控制在可接受的水平。因此,管理者更关心的是如何减少顾客的退货行为,降低退货数量。
1.2顾客退货行为。顾客满意度是预测顾客行为的可靠指标[3]。在这里,我们把零售行业顾客采取退货行为的原因分为满意度不够和无条件退货两类。无条件退货即顾客退货的原因无法确定,对这类退货进行分析较为困难。而顾客满意度不够,通常显性地表现为对商品质量或服务质量的抱怨。
顾客行为也可通过忠诚度、支付更多、转移行为、内部反应和外部反应等5个变量来进行测评[3]。对零售商而言,当顾客对商品质量或服务质量不满意时,其忠诚度会下降,支付更多的可能性会降低,转移行为增多,内部反应表现出向本零售企业抱怨、要求赔偿等,外部反应则表现为负面宣传、通过第三方进行交涉等。因此,退货行为在降低该商品的品牌声誉的同时,也给零售商带来了不利影响。
在基于客户订货(Build To Order, BTO)的生产模式下,零售企业对供应商有着显著的影响力。因此,利用这些来自逆向物流信息系统的退货数据,零售企业可定期地在产品质量上对供应商进行评估,为相关决策提供依据。
1.3产品质量与供应商评估。在供应链管理中,价格、质量、交货提前期、服务水准等4个因素是对供应商进行评估的关键因素[4]。质量是评价供应商的基本指标之一,是指供应商的产品满足企业需求的程度。客户企业对产品注重的是整体质量,次品过多可能直接导致客户企业无法按计划运营,而少量产品质量过高只会增加供应商的成本[5]。因此,每一个零售企业都应建立自己的质量标准,产品质量符合双方的约定即可。在这里,质量标准用每100件产品中的破损数量值即次品率来表征。通过对逆向物流数据进行数据挖掘,可提取包括次品率在内的很多新信息。这些知识既可用自身选择供应商的决策,也可反馈给供应商以改进产品质量,增强本供应链的竞争力。
2零售业逆向物流中的数据挖掘应用
2.1.2基于成对数据的t检验法。基于成对数据的t检验用于对2个供应商进行评估,判断其中一个的供货质量是否有显著的优势。选用这一方法的原因在于:这里讨论的样本均由历史数据组成。在不同时期,原材料价格、供需关系等市场条件是不同的。反之,同一时期来自不同供应商的次品率数据是在相似条件下出现的,可认为是成对的。
依次进行上述3种假设检验方法,可了解某种商品中不同供应商的供货质量情况,为选择和评估供应商提供依据。
2.2数据挖掘过程。零售业逆向物流的退货数据部分来自顾客因质量缺陷的退货,部分来自顾客无条件退货,还有的来自零售企业自身的经营活动。为了准确地反映某种商品的次品率,与销售量对应,在逆向物流数据中只选择来自顾客因质量缺陷的这部分退货数据。两者的比值即为该商品的次品率。这样做排除了零售商自身业务活动的干扰,在顾客足够理性的前提下,影响产品质量的因素只剩下一个即供应商,下面对某种商品供货质量进行的统计分析就成为单因素分析。数据挖掘步骤见图1。
在图1中,对来自各供应商的次品率数据进行方差分析后,若发现数据间存在明显差异,下一步就进行成对t检验;否则,可认为不需要对该种商品的各类别进行比较,下一步直接进行单个类别的t检验。因此,通过这一数据挖掘过程,无论该种商品有多个供应商,还是只有一个,都可得到相应的评估结果。
2.3数据挖掘实例
2.3.1数据准备。首先进行数据准备,将所需的各个商店前端设备(POS、扫描仪)采集来的原始销售数据和逆向物流信息系统采集来的退货数据纳入挖掘数据库。原始销售数据表用来统计指定商品的销售量,逆向物流数据表则用来统计指定商品的退货数量。这里按评估的时间周期对这些数据分类,那么在不同评估周期内,具有不同的销售量和退货量,求得的次品率也不相同。
2.3.3结果分析。上述实例中首先由方差分析法得到来自3个供应商的次品率显著不同的结论;然后用成对数据的t检验法对这3类次品率进行两两比较,找出差异明显的类别;最后以规定标准为依据,对各商品类进行逐一判断。通过这一挖掘过程,完成了对该种商品的全部3个供应商的评估,结论为:01类供应商异常,表现为供货质量明显优于02类;02类供应商异常,表现为供货质量明显劣于01类且明显劣于规定标准;其余供应商为正常状态。
3结束语
数据挖掘技术在零售业逆向物流领域具有广泛的应用前景,如通过收集商品退货信息,可了解产品的真实销售情况,对市场变化做出快速反应;通过收集逆向物流信息,可了解顾客对商品的外观或功能建议,与上级供应链成员共享信息,优化整个供应链。本文提出的统计分析方法用于在产品质量上对供应商进行评估。为减少干扰,可适当增大样本容量,灵活设置显著性水平α的值,以提高数据挖掘的有效性。
参考文献:
[1] 朱明. 数据挖掘[M]. 合肥:中国科学技术大学出版社,2002.
[2] 鄢飞. 广义逆向物流浅析[J]. 西安财经学院学报,2006(2):75-77.
[3] 刘耘. 电子企业消费者行为预测模型及应用[J]. 通信企业管理,2006(8):68-69.
[4] 孙朝苑,彭其渊. 利用多维灰度评估进行供应商的选择与评价[J]. 西南交通大学学报,2004,39(3):277-280.
[5] 何彤. 外资企业对供应商的评估要素[J]. 中国物流与采购,2005(15):58-59.
[6] 盛骤,谢式千,潘承毅. 概率论与数理统计[M]. 2版. 北京:高等教育出版社,1989.
“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”