论文部分内容阅读
摘 要:本文针对电子商务产品销售组合的智能化构建开展研究,将关联规则融入PDCA循环之中,利用其螺旋上升、持续优化的机制,不断提升和改进关联规则的生成,并将随着时间推移不断变化的消费者需求因素引入到产品组合的构建之中,从而帮助电商企业智能化动态构建和优化产品组合。
关键词:关联规则;PDCA;产品组合;电子商务
一、引言
随着电子商务的高速发展,企业的竞争不断加剧,如何为消费者有效地推送产品组合,成为电商企业提升客单价与盈利能力的重要手段。传统的产品销售组合往往依赖于企业经营者的个人经验以及静态的统计分析,时效滞后且精准度不足。本文将PDCA戴明循环与关联规则数据挖掘方法相结合,帮助企业开展产品组合的智能化构建研究,利用企业历史交易数据,动态地、精准地智能化构建产品组合。
二、研究背景与相关理论
1.研究背景
国内外学者针对大数据、数据挖掘技术与电子商务的结合开展了大量研究,但数据挖掘与电商产品组合相关的研究较少,与管理方法融合的研究更为缺乏。本文将PDCA循环的管理思想与关联规则融合应用,通过计划、执行、检查、处理的迭代思想,不断循环调整与优化,实时、动态、精准的生成产品组合。
2.相关理论
(1)关联规则
关联规则是数据挖掘的重要技术,其反映一个事物与其他事物之间的相互依存性和关联性。关联规则挖掘目的是发现强关联规则,也就是从数据中挖掘出满足用户需要设定的最小支持度和最小置信度的规则。
关联规则的一般表示形式为:X->Y(S=s%,C=c%)
其中:X表示前项可以是一个项目或者项集,Y表示后项一般为一个项目。
支持度Support(X->Y)=P(X∪Y)是X与Y同时被消费者购买的概率。
置信度Confidence(X->Y)=P(Y|X)是消费者在购买X之后再购买Y的条件概率。
提升度Lift(X->Y)=P(Y|X)/P(X)P(Y)是判断关联规则实用性的指标,当提升度大于1,表示X出现对Y的正向促进,如果小于1,则X与Y为负,等于1则表示不相关。
本文将选取Apriori作为关联规则的挖掘算法,该算法具有单维、单层、布尔型的特点,是经典的关联规则算法。
(2)PDCA循环
PDCA循环将管理分为四个阶段,是一个不断前进的工作循环,每通过一次PDCA循环,就要进行检查总结,分析仍存在问题,提出新目标,再进行循环优化。
(3)产品组合
产品组合指某个销售商所能提供给消费者整套的或者搭配销售的产品或项目组合,产品之间往往具有相关性,能够引导消费者同时购买,通过产品組合的设计,可以帮助企业优化客户体验、提升客户转化率与客单价。
三、模型设计
企业在经营过程中,都会积累客户消费的历史记录,这些历史记录包含着不同消费者的购物清单,关联规则的通过分析这些历史购物清单,发现产品之间的联系,进而挖掘出一系列产品组合。模型可以按固定时间段或者固定销售量,对样本数据进行分组,实施多次基于PDCA循环的数据分析与挖掘。本文两轮PDCA分组如下:
2020年11月01日-2020年12月13日A组样本数据1641条,A组校验组数据652条。
2020年12月14日-2021年01月28日B组样本数据1975条,B组校验组数据1248条。
并按照以下流程进行两轮P-D-C-A循环数据挖掘,分析模型如下图:
(1)Plan:实施目标与计划的制定;(2)Do:关联规则模型设定与运行;
(3)Check:计算效验组概率值,执行结果检查;(4)Act:效果评估与优化参数。
四、数据准备与实验分析
1.数据准备
(1)数据来源
本文选取具有较高销售量的某化妆品天猫旗舰店作为研究对象,通过八爪鱼数据采集软件爬取全店所有商品上述时间段的评论内容,结合购买用户信息、购买时间和商品SKU模拟还原交易订单。本文采集该店铺全店共约5万条评论数据,模拟还原交易订单5516条。
(2)数据预处理
本文选取用户标识和商品标识信息两个数据项,然后对数据实行转换、清洗等预处理操作,得到如表1形式的购物篮数据,在依据确准的数据类型通过关联规则挖掘算法实行数据挖掘,分析评估挖掘结果。
①Plan:实施目标与计划的制定
在第一轮环节,企业可以通过智能化产品组合的构建,提升产品推送的精准度,促进消费者关联购买,提升消费者体验和提高企业客单价,利用历史交易数据的关联规则挖掘,为企业自动化推送产品组合。
②Do:关联规则模型设定与运行
运用R语言对采集的数据进行处理,根据综合分析本轮参数设定为:最小支持度为1.1%,最小置信度为50%,通过R语言导入A组交易样本数据1641条,运行Apriori算法如下:
共生成的关联规则共24条,经过对关联规则的提升度进行排序,表2展示了前8条关联规则。
生产的24条规则置信度在50%以上且提升度都远大于1,说明规则有效且有实用价值,即购买左侧商品项的买家有非常大的可能性会同时购买右侧商品项,如“气垫BB霜&冻感水光唇釉->丝绒雾面口红”的支持度与置信度都较高且提升度达到了9.72,此三个商品非常适合作为关联产品同时展现,也适合作为套餐进行捆绑销售。
根据生成的关联规则,企业可以以此为依据来对生成产品组合,在关联营销推送产品组合,让客户能够更加方便地浏览到所需的产品,获取需要的组合套餐,促进客户的捆绑销售、增加销售额和提升购物体验。 ③Check:计算效验组概率值,执行结果检查
接下来将A组样本数据产生的关联规则在A组校验组数据中进行核查檢验,计算关联规则在校验数据中出现的置信度,挖掘生成的关联规则,在校验集中有较高的置信度,说明规则有可靠性高,表3展示了前8条关联规则在校验组中的置信度。
④Act:效果评估与优化参数
本轮执行过程产生了评估指标较好的关联规则,并且验证了这些规则的有效性与实用性,企业可以将这些规则运用于产品组合关联营销、产品套餐设计和客户接触点优化等领域,但也存在关联规则数量偏少,所能覆盖的产品种类偏少的不足。
(2)第二轮P-D-C-A
①Plan:实施目标与计划的制定
经过上一轮PDCA的运行,企业能够高质量挖掘出一系列关联规则,但数量偏少,覆盖产品较少。因此本轮需对支持度、置信度参数进行调整,另在结果分析过程需考虑消费者需求变化因素。
②Do:关联规则模型设定与运行
本轮最小支持度为0.7%,最小置信度为35%,通过R语言导入B组交易样本数据1975条,运行Apriori算法如下:
共生成的关联规则共36条,经过对关联规则的提升度进行排序,表4展示了前8条关联规则。本轮关联规则数量得到了一定提升,规则的支持度虽然有所调低,但仍有较高的频数,置信度处于较高水平,规则提升度均远大于1,规则具有较高的有效性与实用性。
③Check:计算效验组概率值,执行结果检查
通过计算规则在B组校验数据中的置信度,均得到的较高的置信度,因此验证了生成的关联规则结果具有较高的可信度,表5展示了前8条关联规则在校验组的置信度。
④Act:效果评估与优化参数
根据本轮的执行产生了更多的关联规则,且均有较高的有效性与实用性,能够覆盖更多的产品,企业可以运用该方法智能化产品组合构建。此外企业需根据第一轮与第二轮产品的关联规则的差异变化,了解季节性、活动性及流行趋势等因素影响对产品组合的影响,与时俱进,不断优化与更新产品组合。
3.实验结果分析
(1)虽然本文两轮PDCA过程都获得了优质的关联规则,但支持度与置信度的设定会较大的影响关联规则生成,将关联规则支持度与置信度的调整融入到PDCA循环中,将能实现参数的精细化、动态调整。
(2)将数据源根据时间维度或销量维度进行合理的划分,能够有效地帮助企业挖掘贴近市场需求变化的关联规则。
(3)企业可根据支持度、置信度的以及提升度的变化趋势对生成关联规则的发展趋势跟踪,帮助企业较早地捕捉到产品及产品组合的需求和生命周期变化。
(4)企业可以对多轮PDCA循环产生的规则进行统计分析,根据关联规则随时间的变化程度的大小,区别性地实施不同的营销策略。
五、总结
本文将PDCA管理方法与关联规则数据挖掘算法相结合,实现了数据挖掘算法在企业商务应用的规范规设计,通过PDCA循环迭代,螺旋上升的机制,动态地调整关联规则算法应用,保证了数据挖掘效果的可靠性与实用性,企业通过多轮的PDCA循环迭代,能够有效积累具有时间维度的关联规则,帮助企业识别产品及产品组合的变化趋势与生命周期,进而帮助企业更加全面系统地实现产品组合的智能化构建。
参考文献:
[1]李冬云.利用关联规则挖掘技术实现数字图书馆个性化推荐服务[J].兰台内外,2020(34):40-42.
[2]郝海涛,马元元.基于加权关联规则挖掘算法的电子商务商品推荐系统研究[J].现代电子技术,2016,39(15):133-136.
[3]菲利普.科特勒,加里.阿姆斯特朗.营销学导论[M].华夏出版社,1998.
[4]朱晴.融合关联规则挖掘算法的信息化教学管理系统设计[J].现代电子技术,2020,43(23):159-163.
作者简介:周丽莉(1999.07- ),女,汉族,籍贯:广东省揭阳市,本科在读,研究方向:电子商务;通讯作者:王宝军(1985.08- ),男,汉族,籍贯:江西省景德镇市,研究生,工程师,研究方向:电子商务、数据挖掘
关键词:关联规则;PDCA;产品组合;电子商务
一、引言
随着电子商务的高速发展,企业的竞争不断加剧,如何为消费者有效地推送产品组合,成为电商企业提升客单价与盈利能力的重要手段。传统的产品销售组合往往依赖于企业经营者的个人经验以及静态的统计分析,时效滞后且精准度不足。本文将PDCA戴明循环与关联规则数据挖掘方法相结合,帮助企业开展产品组合的智能化构建研究,利用企业历史交易数据,动态地、精准地智能化构建产品组合。
二、研究背景与相关理论
1.研究背景
国内外学者针对大数据、数据挖掘技术与电子商务的结合开展了大量研究,但数据挖掘与电商产品组合相关的研究较少,与管理方法融合的研究更为缺乏。本文将PDCA循环的管理思想与关联规则融合应用,通过计划、执行、检查、处理的迭代思想,不断循环调整与优化,实时、动态、精准的生成产品组合。
2.相关理论
(1)关联规则
关联规则是数据挖掘的重要技术,其反映一个事物与其他事物之间的相互依存性和关联性。关联规则挖掘目的是发现强关联规则,也就是从数据中挖掘出满足用户需要设定的最小支持度和最小置信度的规则。
关联规则的一般表示形式为:X->Y(S=s%,C=c%)
其中:X表示前项可以是一个项目或者项集,Y表示后项一般为一个项目。
支持度Support(X->Y)=P(X∪Y)是X与Y同时被消费者购买的概率。
置信度Confidence(X->Y)=P(Y|X)是消费者在购买X之后再购买Y的条件概率。
提升度Lift(X->Y)=P(Y|X)/P(X)P(Y)是判断关联规则实用性的指标,当提升度大于1,表示X出现对Y的正向促进,如果小于1,则X与Y为负,等于1则表示不相关。
本文将选取Apriori作为关联规则的挖掘算法,该算法具有单维、单层、布尔型的特点,是经典的关联规则算法。
(2)PDCA循环
PDCA循环将管理分为四个阶段,是一个不断前进的工作循环,每通过一次PDCA循环,就要进行检查总结,分析仍存在问题,提出新目标,再进行循环优化。
(3)产品组合
产品组合指某个销售商所能提供给消费者整套的或者搭配销售的产品或项目组合,产品之间往往具有相关性,能够引导消费者同时购买,通过产品組合的设计,可以帮助企业优化客户体验、提升客户转化率与客单价。
三、模型设计
企业在经营过程中,都会积累客户消费的历史记录,这些历史记录包含着不同消费者的购物清单,关联规则的通过分析这些历史购物清单,发现产品之间的联系,进而挖掘出一系列产品组合。模型可以按固定时间段或者固定销售量,对样本数据进行分组,实施多次基于PDCA循环的数据分析与挖掘。本文两轮PDCA分组如下:
2020年11月01日-2020年12月13日A组样本数据1641条,A组校验组数据652条。
2020年12月14日-2021年01月28日B组样本数据1975条,B组校验组数据1248条。
并按照以下流程进行两轮P-D-C-A循环数据挖掘,分析模型如下图:
(1)Plan:实施目标与计划的制定;(2)Do:关联规则模型设定与运行;
(3)Check:计算效验组概率值,执行结果检查;(4)Act:效果评估与优化参数。
四、数据准备与实验分析
1.数据准备
(1)数据来源
本文选取具有较高销售量的某化妆品天猫旗舰店作为研究对象,通过八爪鱼数据采集软件爬取全店所有商品上述时间段的评论内容,结合购买用户信息、购买时间和商品SKU模拟还原交易订单。本文采集该店铺全店共约5万条评论数据,模拟还原交易订单5516条。
(2)数据预处理
本文选取用户标识和商品标识信息两个数据项,然后对数据实行转换、清洗等预处理操作,得到如表1形式的购物篮数据,在依据确准的数据类型通过关联规则挖掘算法实行数据挖掘,分析评估挖掘结果。
①Plan:实施目标与计划的制定
在第一轮环节,企业可以通过智能化产品组合的构建,提升产品推送的精准度,促进消费者关联购买,提升消费者体验和提高企业客单价,利用历史交易数据的关联规则挖掘,为企业自动化推送产品组合。
②Do:关联规则模型设定与运行
运用R语言对采集的数据进行处理,根据综合分析本轮参数设定为:最小支持度为1.1%,最小置信度为50%,通过R语言导入A组交易样本数据1641条,运行Apriori算法如下:
共生成的关联规则共24条,经过对关联规则的提升度进行排序,表2展示了前8条关联规则。
生产的24条规则置信度在50%以上且提升度都远大于1,说明规则有效且有实用价值,即购买左侧商品项的买家有非常大的可能性会同时购买右侧商品项,如“气垫BB霜&冻感水光唇釉->丝绒雾面口红”的支持度与置信度都较高且提升度达到了9.72,此三个商品非常适合作为关联产品同时展现,也适合作为套餐进行捆绑销售。
根据生成的关联规则,企业可以以此为依据来对生成产品组合,在关联营销推送产品组合,让客户能够更加方便地浏览到所需的产品,获取需要的组合套餐,促进客户的捆绑销售、增加销售额和提升购物体验。 ③Check:计算效验组概率值,执行结果检查
接下来将A组样本数据产生的关联规则在A组校验组数据中进行核查檢验,计算关联规则在校验数据中出现的置信度,挖掘生成的关联规则,在校验集中有较高的置信度,说明规则有可靠性高,表3展示了前8条关联规则在校验组中的置信度。
④Act:效果评估与优化参数
本轮执行过程产生了评估指标较好的关联规则,并且验证了这些规则的有效性与实用性,企业可以将这些规则运用于产品组合关联营销、产品套餐设计和客户接触点优化等领域,但也存在关联规则数量偏少,所能覆盖的产品种类偏少的不足。
(2)第二轮P-D-C-A
①Plan:实施目标与计划的制定
经过上一轮PDCA的运行,企业能够高质量挖掘出一系列关联规则,但数量偏少,覆盖产品较少。因此本轮需对支持度、置信度参数进行调整,另在结果分析过程需考虑消费者需求变化因素。
②Do:关联规则模型设定与运行
本轮最小支持度为0.7%,最小置信度为35%,通过R语言导入B组交易样本数据1975条,运行Apriori算法如下:
共生成的关联规则共36条,经过对关联规则的提升度进行排序,表4展示了前8条关联规则。本轮关联规则数量得到了一定提升,规则的支持度虽然有所调低,但仍有较高的频数,置信度处于较高水平,规则提升度均远大于1,规则具有较高的有效性与实用性。
③Check:计算效验组概率值,执行结果检查
通过计算规则在B组校验数据中的置信度,均得到的较高的置信度,因此验证了生成的关联规则结果具有较高的可信度,表5展示了前8条关联规则在校验组的置信度。
④Act:效果评估与优化参数
根据本轮的执行产生了更多的关联规则,且均有较高的有效性与实用性,能够覆盖更多的产品,企业可以运用该方法智能化产品组合构建。此外企业需根据第一轮与第二轮产品的关联规则的差异变化,了解季节性、活动性及流行趋势等因素影响对产品组合的影响,与时俱进,不断优化与更新产品组合。
3.实验结果分析
(1)虽然本文两轮PDCA过程都获得了优质的关联规则,但支持度与置信度的设定会较大的影响关联规则生成,将关联规则支持度与置信度的调整融入到PDCA循环中,将能实现参数的精细化、动态调整。
(2)将数据源根据时间维度或销量维度进行合理的划分,能够有效地帮助企业挖掘贴近市场需求变化的关联规则。
(3)企业可根据支持度、置信度的以及提升度的变化趋势对生成关联规则的发展趋势跟踪,帮助企业较早地捕捉到产品及产品组合的需求和生命周期变化。
(4)企业可以对多轮PDCA循环产生的规则进行统计分析,根据关联规则随时间的变化程度的大小,区别性地实施不同的营销策略。
五、总结
本文将PDCA管理方法与关联规则数据挖掘算法相结合,实现了数据挖掘算法在企业商务应用的规范规设计,通过PDCA循环迭代,螺旋上升的机制,动态地调整关联规则算法应用,保证了数据挖掘效果的可靠性与实用性,企业通过多轮的PDCA循环迭代,能够有效积累具有时间维度的关联规则,帮助企业识别产品及产品组合的变化趋势与生命周期,进而帮助企业更加全面系统地实现产品组合的智能化构建。
参考文献:
[1]李冬云.利用关联规则挖掘技术实现数字图书馆个性化推荐服务[J].兰台内外,2020(34):40-42.
[2]郝海涛,马元元.基于加权关联规则挖掘算法的电子商务商品推荐系统研究[J].现代电子技术,2016,39(15):133-136.
[3]菲利普.科特勒,加里.阿姆斯特朗.营销学导论[M].华夏出版社,1998.
[4]朱晴.融合关联规则挖掘算法的信息化教学管理系统设计[J].现代电子技术,2020,43(23):159-163.
作者简介:周丽莉(1999.07- ),女,汉族,籍贯:广东省揭阳市,本科在读,研究方向:电子商务;通讯作者:王宝军(1985.08- ),男,汉族,籍贯:江西省景德镇市,研究生,工程师,研究方向:电子商务、数据挖掘