论文部分内容阅读
摘要:面对瞬息万变的市场经济,不断的制定应对措施保持企业长青成为企业生死存亡的关键,正确的决策会带领企业走向良好的发展。数据在企业决策中扮演着越来越重要的角色,从起初的电子表格到如今的数据仓库,大数据时代的来临,促使着企业重视和利用数据,为企业的经营制定精准的决策服务。数据中潜在的价值不可估量,掌握了这些价值就在一定意义上占据了市场份额,让数据中潜在的价值变成真正的企业营收。
关键词:数据挖掘;数据仓库;用户重购行为
一、数据挖拥技术的发展
信息爆炸的时代带来了信息的过量,为了提高信息的利用率,从海量的数据中发现有价值的知识,数据挖掘技术应运而生,并得到了迅猛发展。数据挖掘技术是在很多学科中都会有应用,且在学科中存在着应用的交集,如计算机技术与医学技术。在1989年召开的第十一届国际联合人工智能学术会议上,与数据库技术相关的知识发现首次提出,并且在之后的会议中被多次被提到,逐步成为一系列会议的核心主题。经过了多年的发展,数据挖掘(Data Mining)2)技术日渐成熟,欧美国家的软甲企业也相继推出了数据挖掘工具,并且应用较为广泛,如IBM公司研发的数据挖掘工具 SPSS(Statistical Product and Service Solutions),提供了很多常用的数据挖掘算法,这款软件在国内的企业应用也较为广泛,主要应用在商业领域;国外的高校对数据挖掘技术以及数据挖掘平台的研发也较为重视,怀卡托大学(the University of Waikato)研发了一个公开的数据挖掘工作平台WEKA(Waikato Environment for Knowledge Analysis),平台集合了常用的机器学习算法满足数据挖掘任务的需求,包括对数据进行预处理、分类、回归、聚类、关联规则以及数据的可视化。WEKA平台在数据挖掘领域内得到了高度评价,被誉为数据挖掘和机器学习历史上的标志性事件,是含括算法比较全面的数据挖掘工具之一,实际应用价值较高。在业内的国际会议上,该平台还斩获殊荣,荣获了数据挖掘和知识探索领域的最高服务奖。
二、基于RFM模型和决策树的用户重购行为预测
在大数据时代,个性化的服务已经成为提高企业核心竞争能力的关键,企业越来越重视客户数据,将其视为增加市场份额的关键因素。客户数据中隐含了很高的商业价值,这些价值亟待分析和挖掘。客户的消费能力水平因人而异,通过数据分析和挖掘技术,可以将用户分为不同的消费等级,进而对每个消费等级的用户进行不同的营销和推荐策略,提高精准营销的能力,对提高商品的推荐精度、提高营收和挽留重要的用户具有十分重要的意义。常用的分类算法包括逻辑回归(Logistic Regression)、反向传递神经网络(Back Propagation Neural Network)、决策树以及k-Means算法等,在本章中采用在营销领域比较成熟的RFM模型和决策树算法,对客户的重购行为进行分析预测。
在营销领域中,RFM模型被广泛用来对已消费客户进行分群并且寻找“最有价值”的客户,主要应用在对商场零售业客户和电信业客户分析以及其他产生购买行为的场景等。本章中将RFM模型和C5.0决策树联合应用,预测了智能电视用户对视频套餐的重购行为,为电视运营部门提供了决策支持。
(一)客户流失
1.套餐客户流失的定义
在大数据时代,为客户提供个性化服务是保持企业增长力的关键。对于客户流失,不同的领域对此有着不同的见解和定义。理论上讲,由于公司营销手段不符合客户和合作企业利益而终止合作的现象称为客户流失。在电商领域,用户在对一家店进行消费后不再消费即定义为客户流失。对于智能电视来说,用户在其已购买的影片套餐到达有效期后的一段周期内不再产生购买套餐的行为,即定义为客户流失。客户流失对企业造成不可逆转的损失,也造成了企业声誉的下降,预测客户流失,提前获悉用户下一步的购买行为,为运营部门提供决策支持,在一定程度上维持现有的用户,同时改进造成客户流失的营销策略。
2.客户流失的周期选取
合理地去定义用户流失时间段长度的问题,是在进行建模过程中的数据周期选取是否合理的关键,如果客户的流失周期选取误差,将直接影响模型的准确性和合理性,所以流失周期的选取需要有一定的说服性。
不同的应用场景对这个周期的选择有所不同,在智能电视套餐购买的场景中,我们将80%的用户从套餐结束到继续购买的时间差定为流失周期,如果用户超过这个时间段并未继续购买套餐,我们将此类用户定义为流失。为此,从用户购买数据中整理得到用户在套餐有效期结束后再次購买套餐的时间差。
(二)衡量用户价值指数
1. RFM模型概述
RFM模型属于客户关系管理(CRM)分析模式,用来衡量用户的消费潜力和创造盈利的能力,被广泛应用到各个消费领域。根据美国数据库营销研究所ArthurHughes的研究结论:在客户关系的管理建模分析中,与用户相关的三个因素对决定用户的忠诚度和预测用户的价值起着关键的作用,分别是最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。
R(Recency):表示用户最近一次购买商品的时间距考察日期的时间。理论上来讲,Recency主要与近因效应有关。根据近因效应的概述,近期产生购买行为的用户,在对其提供服务或者商品推荐时,相比长期未产生购买行为的用户更容易产生互动行为。用户间Recency相隔时间越长,近因效应就更加明显。
F(Frequency):表示用户在考察日期之前一段时间内的消费频率。购买频率高的用户,忠诚度比较高,增加用户的购买次数可以有效提高市场的占有率。
M (Monetary):表示用户在考察日期之前一段时间内的消费金额。消费金额是衡量客户消费能力的最直接的指标。从管理学的“二八定律”来讲,通常一个公司80%的收益来自它20%的客户或者是项目。
RFM模型可以准确的预测客户的价值,对企业的营销决策以及个性化的服务提供依据。在客户关系管理(CRM)的分析模式中,很多分析型的模型主要从客户的贡献度的维度进行分析,RFM主要从客户的行为来给用户分群,提供精准营销的决策支持。
RFM模型适用于销售多种商品的零售业领域,如日常消费品、化妆品、小家电、录像带店、超市等;RFM对于餐饮业、电信业、交通运输业、证券业等也很适合。
结束语
数据挖掘技术得到了成熟广泛的应用,在各个行业中的影响已经初见端倪。近年来,在大数据迅猛的发展和数据仓库技术的日益成熟的条件下,数据挖掘技术在各个行业得到了很好的应用,尤其是在电信、交通以及银行业,已经有了一套成熟的基于数据仓库的数据挖掘系统。
参考文献
[1] TM Nguyen, AM Tjoa, J TrujilloData.Warehousing and Knowledge Discovery: A Chronological View of Research Challenges.Data Warehousing & Knowledge Discovery, International Conference, Dawak, Copenhagen, Denmark, August -2005.
关键词:数据挖掘;数据仓库;用户重购行为
一、数据挖拥技术的发展
信息爆炸的时代带来了信息的过量,为了提高信息的利用率,从海量的数据中发现有价值的知识,数据挖掘技术应运而生,并得到了迅猛发展。数据挖掘技术是在很多学科中都会有应用,且在学科中存在着应用的交集,如计算机技术与医学技术。在1989年召开的第十一届国际联合人工智能学术会议上,与数据库技术相关的知识发现首次提出,并且在之后的会议中被多次被提到,逐步成为一系列会议的核心主题。经过了多年的发展,数据挖掘(Data Mining)2)技术日渐成熟,欧美国家的软甲企业也相继推出了数据挖掘工具,并且应用较为广泛,如IBM公司研发的数据挖掘工具 SPSS(Statistical Product and Service Solutions),提供了很多常用的数据挖掘算法,这款软件在国内的企业应用也较为广泛,主要应用在商业领域;国外的高校对数据挖掘技术以及数据挖掘平台的研发也较为重视,怀卡托大学(the University of Waikato)研发了一个公开的数据挖掘工作平台WEKA(Waikato Environment for Knowledge Analysis),平台集合了常用的机器学习算法满足数据挖掘任务的需求,包括对数据进行预处理、分类、回归、聚类、关联规则以及数据的可视化。WEKA平台在数据挖掘领域内得到了高度评价,被誉为数据挖掘和机器学习历史上的标志性事件,是含括算法比较全面的数据挖掘工具之一,实际应用价值较高。在业内的国际会议上,该平台还斩获殊荣,荣获了数据挖掘和知识探索领域的最高服务奖。
二、基于RFM模型和决策树的用户重购行为预测
在大数据时代,个性化的服务已经成为提高企业核心竞争能力的关键,企业越来越重视客户数据,将其视为增加市场份额的关键因素。客户数据中隐含了很高的商业价值,这些价值亟待分析和挖掘。客户的消费能力水平因人而异,通过数据分析和挖掘技术,可以将用户分为不同的消费等级,进而对每个消费等级的用户进行不同的营销和推荐策略,提高精准营销的能力,对提高商品的推荐精度、提高营收和挽留重要的用户具有十分重要的意义。常用的分类算法包括逻辑回归(Logistic Regression)、反向传递神经网络(Back Propagation Neural Network)、决策树以及k-Means算法等,在本章中采用在营销领域比较成熟的RFM模型和决策树算法,对客户的重购行为进行分析预测。
在营销领域中,RFM模型被广泛用来对已消费客户进行分群并且寻找“最有价值”的客户,主要应用在对商场零售业客户和电信业客户分析以及其他产生购买行为的场景等。本章中将RFM模型和C5.0决策树联合应用,预测了智能电视用户对视频套餐的重购行为,为电视运营部门提供了决策支持。
(一)客户流失
1.套餐客户流失的定义
在大数据时代,为客户提供个性化服务是保持企业增长力的关键。对于客户流失,不同的领域对此有着不同的见解和定义。理论上讲,由于公司营销手段不符合客户和合作企业利益而终止合作的现象称为客户流失。在电商领域,用户在对一家店进行消费后不再消费即定义为客户流失。对于智能电视来说,用户在其已购买的影片套餐到达有效期后的一段周期内不再产生购买套餐的行为,即定义为客户流失。客户流失对企业造成不可逆转的损失,也造成了企业声誉的下降,预测客户流失,提前获悉用户下一步的购买行为,为运营部门提供决策支持,在一定程度上维持现有的用户,同时改进造成客户流失的营销策略。
2.客户流失的周期选取
合理地去定义用户流失时间段长度的问题,是在进行建模过程中的数据周期选取是否合理的关键,如果客户的流失周期选取误差,将直接影响模型的准确性和合理性,所以流失周期的选取需要有一定的说服性。
不同的应用场景对这个周期的选择有所不同,在智能电视套餐购买的场景中,我们将80%的用户从套餐结束到继续购买的时间差定为流失周期,如果用户超过这个时间段并未继续购买套餐,我们将此类用户定义为流失。为此,从用户购买数据中整理得到用户在套餐有效期结束后再次購买套餐的时间差。
(二)衡量用户价值指数
1. RFM模型概述
RFM模型属于客户关系管理(CRM)分析模式,用来衡量用户的消费潜力和创造盈利的能力,被广泛应用到各个消费领域。根据美国数据库营销研究所ArthurHughes的研究结论:在客户关系的管理建模分析中,与用户相关的三个因素对决定用户的忠诚度和预测用户的价值起着关键的作用,分别是最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。
R(Recency):表示用户最近一次购买商品的时间距考察日期的时间。理论上来讲,Recency主要与近因效应有关。根据近因效应的概述,近期产生购买行为的用户,在对其提供服务或者商品推荐时,相比长期未产生购买行为的用户更容易产生互动行为。用户间Recency相隔时间越长,近因效应就更加明显。
F(Frequency):表示用户在考察日期之前一段时间内的消费频率。购买频率高的用户,忠诚度比较高,增加用户的购买次数可以有效提高市场的占有率。
M (Monetary):表示用户在考察日期之前一段时间内的消费金额。消费金额是衡量客户消费能力的最直接的指标。从管理学的“二八定律”来讲,通常一个公司80%的收益来自它20%的客户或者是项目。
RFM模型可以准确的预测客户的价值,对企业的营销决策以及个性化的服务提供依据。在客户关系管理(CRM)的分析模式中,很多分析型的模型主要从客户的贡献度的维度进行分析,RFM主要从客户的行为来给用户分群,提供精准营销的决策支持。
RFM模型适用于销售多种商品的零售业领域,如日常消费品、化妆品、小家电、录像带店、超市等;RFM对于餐饮业、电信业、交通运输业、证券业等也很适合。
结束语
数据挖掘技术得到了成熟广泛的应用,在各个行业中的影响已经初见端倪。近年来,在大数据迅猛的发展和数据仓库技术的日益成熟的条件下,数据挖掘技术在各个行业得到了很好的应用,尤其是在电信、交通以及银行业,已经有了一套成熟的基于数据仓库的数据挖掘系统。
参考文献
[1] TM Nguyen, AM Tjoa, J TrujilloData.Warehousing and Knowledge Discovery: A Chronological View of Research Challenges.Data Warehousing & Knowledge Discovery, International Conference, Dawak, Copenhagen, Denmark, August -2005.