基于数据挖掘和数据仓库的用户重购行为的研究

来源 :安家(建筑与工程) | 被引量 : 0次 | 上传用户:lvyuxuan3652009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:面对瞬息万变的市场经济,不断的制定应对措施保持企业长青成为企业生死存亡的关键,正确的决策会带领企业走向良好的发展。数据在企业决策中扮演着越来越重要的角色,从起初的电子表格到如今的数据仓库,大数据时代的来临,促使着企业重视和利用数据,为企业的经营制定精准的决策服务。数据中潜在的价值不可估量,掌握了这些价值就在一定意义上占据了市场份额,让数据中潜在的价值变成真正的企业营收。
  关键词:数据挖掘;数据仓库;用户重购行为
  一、数据挖拥技术的发展
  信息爆炸的时代带来了信息的过量,为了提高信息的利用率,从海量的数据中发现有价值的知识,数据挖掘技术应运而生,并得到了迅猛发展。数据挖掘技术是在很多学科中都会有应用,且在学科中存在着应用的交集,如计算机技术与医学技术。在1989年召开的第十一届国际联合人工智能学术会议上,与数据库技术相关的知识发现首次提出,并且在之后的会议中被多次被提到,逐步成为一系列会议的核心主题。经过了多年的发展,数据挖掘(Data Mining)2)技术日渐成熟,欧美国家的软甲企业也相继推出了数据挖掘工具,并且应用较为广泛,如IBM公司研发的数据挖掘工具 SPSS(Statistical Product and Service Solutions),提供了很多常用的数据挖掘算法,这款软件在国内的企业应用也较为广泛,主要应用在商业领域;国外的高校对数据挖掘技术以及数据挖掘平台的研发也较为重视,怀卡托大学(the University of Waikato)研发了一个公开的数据挖掘工作平台WEKA(Waikato Environment for Knowledge Analysis),平台集合了常用的机器学习算法满足数据挖掘任务的需求,包括对数据进行预处理、分类、回归、聚类、关联规则以及数据的可视化。WEKA平台在数据挖掘领域内得到了高度评价,被誉为数据挖掘和机器学习历史上的标志性事件,是含括算法比较全面的数据挖掘工具之一,实际应用价值较高。在业内的国际会议上,该平台还斩获殊荣,荣获了数据挖掘和知识探索领域的最高服务奖。
  二、基于RFM模型和决策树的用户重购行为预测
  在大数据时代,个性化的服务已经成为提高企业核心竞争能力的关键,企业越来越重视客户数据,将其视为增加市场份额的关键因素。客户数据中隐含了很高的商业价值,这些价值亟待分析和挖掘。客户的消费能力水平因人而异,通过数据分析和挖掘技术,可以将用户分为不同的消费等级,进而对每个消费等级的用户进行不同的营销和推荐策略,提高精准营销的能力,对提高商品的推荐精度、提高营收和挽留重要的用户具有十分重要的意义。常用的分类算法包括逻辑回归(Logistic Regression)、反向传递神经网络(Back Propagation Neural Network)、决策树以及k-Means算法等,在本章中采用在营销领域比较成熟的RFM模型和决策树算法,对客户的重购行为进行分析预测。
  在营销领域中,RFM模型被广泛用来对已消费客户进行分群并且寻找“最有价值”的客户,主要应用在对商场零售业客户和电信业客户分析以及其他产生购买行为的场景等。本章中将RFM模型和C5.0决策树联合应用,预测了智能电视用户对视频套餐的重购行为,为电视运营部门提供了决策支持。
  (一)客户流失
  1.套餐客户流失的定义
  在大数据时代,为客户提供个性化服务是保持企业增长力的关键。对于客户流失,不同的领域对此有着不同的见解和定义。理论上讲,由于公司营销手段不符合客户和合作企业利益而终止合作的现象称为客户流失。在电商领域,用户在对一家店进行消费后不再消费即定义为客户流失。对于智能电视来说,用户在其已购买的影片套餐到达有效期后的一段周期内不再产生购买套餐的行为,即定义为客户流失。客户流失对企业造成不可逆转的损失,也造成了企业声誉的下降,预测客户流失,提前获悉用户下一步的购买行为,为运营部门提供决策支持,在一定程度上维持现有的用户,同时改进造成客户流失的营销策略。
  2.客户流失的周期选取
  合理地去定义用户流失时间段长度的问题,是在进行建模过程中的数据周期选取是否合理的关键,如果客户的流失周期选取误差,将直接影响模型的准确性和合理性,所以流失周期的选取需要有一定的说服性。
  不同的应用场景对这个周期的选择有所不同,在智能电视套餐购买的场景中,我们将80%的用户从套餐结束到继续购买的时间差定为流失周期,如果用户超过这个时间段并未继续购买套餐,我们将此类用户定义为流失。为此,从用户购买数据中整理得到用户在套餐有效期结束后再次購买套餐的时间差。
  (二)衡量用户价值指数
  1. RFM模型概述
  RFM模型属于客户关系管理(CRM)分析模式,用来衡量用户的消费潜力和创造盈利的能力,被广泛应用到各个消费领域。根据美国数据库营销研究所ArthurHughes的研究结论:在客户关系的管理建模分析中,与用户相关的三个因素对决定用户的忠诚度和预测用户的价值起着关键的作用,分别是最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。
  R(Recency):表示用户最近一次购买商品的时间距考察日期的时间。理论上来讲,Recency主要与近因效应有关。根据近因效应的概述,近期产生购买行为的用户,在对其提供服务或者商品推荐时,相比长期未产生购买行为的用户更容易产生互动行为。用户间Recency相隔时间越长,近因效应就更加明显。
  F(Frequency):表示用户在考察日期之前一段时间内的消费频率。购买频率高的用户,忠诚度比较高,增加用户的购买次数可以有效提高市场的占有率。
  M (Monetary):表示用户在考察日期之前一段时间内的消费金额。消费金额是衡量客户消费能力的最直接的指标。从管理学的“二八定律”来讲,通常一个公司80%的收益来自它20%的客户或者是项目。
  RFM模型可以准确的预测客户的价值,对企业的营销决策以及个性化的服务提供依据。在客户关系管理(CRM)的分析模式中,很多分析型的模型主要从客户的贡献度的维度进行分析,RFM主要从客户的行为来给用户分群,提供精准营销的决策支持。
  RFM模型适用于销售多种商品的零售业领域,如日常消费品、化妆品、小家电、录像带店、超市等;RFM对于餐饮业、电信业、交通运输业、证券业等也很适合。
  结束语
  数据挖掘技术得到了成熟广泛的应用,在各个行业中的影响已经初见端倪。近年来,在大数据迅猛的发展和数据仓库技术的日益成熟的条件下,数据挖掘技术在各个行业得到了很好的应用,尤其是在电信、交通以及银行业,已经有了一套成熟的基于数据仓库的数据挖掘系统。
  参考文献
  [1] TM Nguyen, AM Tjoa, J TrujilloData.Warehousing and Knowledge Discovery: A Chronological View of Research Challenges.Data Warehousing & Knowledge Discovery, International Conference, Dawak, Copenhagen, Denmark, August -2005.
其他文献
摘要:随着时代的推移和发展,我国建筑工程行业所能够得到的巨大发展契机。其中装配式建筑是一种崭新的建筑模式,凭借其突出的特性和优点以及便捷多样的设计手段,在当今我国的建筑工程师行业中取得了飞速发展。本文以目前装配式工程管理的影响因素为基础,对装配式建筑工程管理的对策进行探讨,以期能够推动我国装配式建筑工程的进步和发展。  关键词:装配式建筑;工程管理;影响因素;对策  建筑的未来发展趋势就是这种装配
期刊
摘要:本文通过型钢底板换撑技术在福建霞浦某工程深基坑支护施工中的成功应用为实例,介绍了一种采用“底板+支撑板带+后浇带传力装置”共同设计形成的深基坑型钢底板换撑方法,并对其施工工艺、体系组成、施工过程控制及监测技术、施工质量控制技术、拆撑方法及安环控制措施等进行了详细的叙述,该新型技术成功地解决了传统深基坑支护系统在进行换撑时由于需二次设置换撑结构而导致的施工周期过长、预留的二次支撑穿墙洞口和结构
期刊
摘要:在水利工程的施工中,做好防渗透处理是关键点所在,因为根据水利工程的特点来看,在建成之后会长期处于水的浸泡中,如果不做好防渗处理,就会直接影响到水利工程整体的安全性。从实际的水利工程防渗处理施工进行分析,随着我国水利工程施工技术的不断上升,让防渗技术也得到了更好的发展,尤其是在防渗施工的材料上,也出现了很多针对不同水利工程使用的材料,让防渗施工更好的进行下去。基于此,本文就以水利工程为导向,对
期刊
摘要:随着我国经济不断发展,综合国力不断增强,现代化进程不断加快,人们的财富增加幅度也很快,所以对于目前的建筑质量和生活质量都有了更高的要求,所以建筑行业为了逐渐满足人们的生活要求对于自身的要有也要不断的增加,因为建筑行业涉及很多的问题以及环节,所以我们就要将一个建筑工程视为一个整体,然后需要密切注意工程中的很多细节,比如水泥就是目前我国建筑行业不可缺少的一个原材料,甚至可以说是基础的材料,很多的
期刊
摘要:对喷射成形H13 钢经不同液氮深冷工艺处理后,对其硬度、冲击性能、拉伸性能以及摩擦磨损性能进行测试,并通过SEM和XRD分析其显微组织及相组成。结果表明,喷射成形H13 钢经深冷处理后硬度和强度变化不大,冲击性能和耐磨性能大幅度提高。深冷工艺为1050 ℃淬火+深冷处理(-196℃×20 h)+二次回火(600℃×2 h)时喷射成形H13钢具有最优的综合性能,其冲击性能和耐磨性能较常规热处理
期刊
摘要:随着环境与能源问题的不断加剧,发展绿色环保、促进生态文明建设已经成为新时代的重要任务。因此各个领域、各个行業都在致力于进行绿色技术的探索与开发。化工行业为我国社会经济的蓬勃发展做出了极大贡献,遵循绿色发展理念,将绿色化工技术合理应用于化工工程,完全合乎国家提出的可持续发展战略,可在降低化工工程成本投入的基础上,有效提升化工工程经济效益,从而推动化工企业健康发展。基于此本文以化工工程工艺中的绿
期刊
摘要:随着城镇化建设脚步的不断加快,城市中的常住人口越来越多,在城市土地面积有限的情况下,只能不断依靠建筑高度的增加以及建筑密度提升来帮助城市得以容纳下更多的人口。在单位居住人口数量不断提升的情况下,居住环境其实是相对比较混乱的,由此可能出现各种居住中的不安全事故,其中火灾是比较常发生的一种。为了帮助城市建筑物具备更强大的防火功能,进一步保障居住者的安全性,在实际进行建筑物建造的过程中可以使用一定
期刊
摘要:当前我国工业生产、居民生活等用电大都是通过10kV电压等级的配电线路进行输送,但10kV配电线路在建设及日常运行维护中面临着诸多问题,如使用的设备数量多、受天气影响大等原因导致线路设备故障情况时常发生。为提高用电安全性、稳定性及可靠性,需要分析了解故障原因,及时做好预防措施。鉴于此,本文主要分析探讨了10kV配电线路常见故障原因,以供参阅。  关键词:10kV配电线路;故障原因;策略  引言
期刊
摘要:随着时代发展,电子信息化已经应用在我们的日常管理工作中,事业单位更应与时俱进,事业单位人事档案更要保证档案的真实有效性,做到及时变更和保密的性质,所以在新时期下事业单位人事档案信息化管理要求更高,作用也更明显,信息化管理无论是对事业单位内部还是对外办事人员都有着不可忽视的作用,所以应不断提高工作人员效率,更好服务人民,促进事业单位健康发展。  关键词:新时期;事业单位;人事档案;信息化管理 
期刊
摘要:在化工工艺生产过程中,条件的复杂性、原料的危险性、工艺的严苛性等,都决定了化工产业生产过程有着高于一般产业的风险系数和事故发生率。所以,对化工工艺过程危险进行有效辨识和管控,不仅能够消除化工工艺生产过程中的潜在安全风险,而且能够有效提高化工工艺生产的效率和质量,对推动化工产业的健康发展具有重要的现实意义,而这也是本文研究的根本出发点。  关键词:化工工艺;危险辨识;安全管控  在化工工艺生产
期刊