论文部分内容阅读
摘 要:数据挖掘技术是电子商务领域未来应用空间最大的一种新技术。橙光扶农平台为了以最快的速度和效率推广滞销农产品,需要迅速找出潜藏于大量客户群体中可以发展为爱心公益推广使者的志愿者。因此,平台利用数据挖掘技术,针对客户历史信息中的多个维度,设计了能迅速分析潜在志愿者的客户细分模块,取得了良好的效果。
关键词:数据挖掘;爱心志愿者;客户细分;维度分析;聚类分析
中图分类号:F49 文献标识码:A doi:10.19311/j.cnki.16723198.2018.05.037
1 引言
扶农电子商务平台是一种新兴商业模式,可以有效的帮助农民朋友解决滞销、掉价等伤农问题。但在我国现阶段从事扶农电子商务的公司中,业务模式缺乏创新、效果不理想、经营目的缺乏社会公益性、技术相对落后等问题比较突出。橙光扶农平台的基于志愿者公益性推广模式,无疑是这一领域的一次新的尝试。平台把一些诸如数据挖掘和云计算等最新先进技术植入到电子商务平台中来。虽然这些技术还在不断的研究改进,但对于电商龙头阿里巴巴等大公司,这些技术已经应用于公司的数据分析与商业模式研究,但没有全面的为个人用户服务。中国电子商务目前依托集约化平台的现象十分普遍,比如淘宝、京东等,基本没有自己独立的客户分析系统,这对于企业长远的发展是不利的,电商市场急需有数据挖掘和云计算功能植入的独立系统平台。
2 国外发展研究现状
由于国外许多电子商务平台发展比较早,也成为我国电子商务行业發展早期的主要参照。他们的数据挖掘、云计算等技术也比我国研究应用的早,也已经有了相对成熟的研究模式和成果,并且早已经将这些成熟的技术应用到了电子商务领域。其中Amazon就是其中的佼佼者,其在电子商务领域不但成了一方霸主,同时也是云计算的最早引领者,数据挖掘与云计算已经成了其主要业务之一。科学技术正在领导世界社会的进步,例如谷歌的无人驾驶汽车、三星视网膜识别技术都在改变着整个世界格局。数据挖掘技术在企业信息系统中的广泛应用已经是整个行业发展的必然,技术不但能提升了自身产品的含金量和竞争力,同时还可以扩展公司的业务范围,帮助企业获取更多的利润源。
3 橙光扶农平台客户细分系统的需求分析
3.1 橙光扶农平台建设背景
近年来,我国农产品滞销现象层出不穷,伤农损农显现不断出现。一边是市民抱怨农副产品价格大涨,一边是农民种植的产品低价贱卖、血本无归。分析这一怪相的原因有很多,比如:中间商垄断收购、压仓抬价;物流不畅、物流成本高;农民无规划盲目种植、造成市场供过于求;一家一户的分散种植经营模式,造成农产品滞销、难卖等等。原因很复杂,但总归有一点基本的问题就是市场供求信息流通不畅,解决的方法之一就是建设高效的信息平台,帮助农民和消费者之间搭建无障碍的信息沟通的桥梁。橙光计划的主要业务目标就是通过建设的电子商务系统平台帮助农户宣传、销售农产品,解决农户农产品滞销这一最大的困难。扶农平台通过搭建供销信息平台“基地+平台+消费者”的现代产销体系,减少中间环节,减少时间地理带来的经济损失,引导农户直接和市场对接。通过自建的电子商务交易平台加强农产品市场信息的发布,拓宽农产品销售渠道,建设农户直通消费者的网络直销平台,帮助滞销的农户销售出农产品。
3.2 客户细分的目的与需求
橙光平台是以公益志愿者为主参与滞销农产品公益推广的运作模式。通过了解,我们发现大部分地区的农户想要尝试新的办法销售出农产品,但是又怕费力不讨好,让辛苦培育出的农产品销售不出或者自己亏本。平台从全国各地招募志愿者,家在滞销地区的在校大学生、非滞销地区的大学生、社会爱心人士等,家在滞销地区的在校大学生更能清楚的了解滞销地区的农产品情况,组织志愿者走进农户,了解农户农产品的销售情况,向农户推广电子商务平台,普及扶农平台相关信息知识,了解市场情况,获得信任,从而帮助他们销售农产品。让农户愿意相信我们并愿意尝试通过我们的扶农平台销售他们的农产品。
对于橙光平台,基于公益的推广模式的重要环节是从全国大量的客户资源中,细分出能够成为我们公益推广使者的客户群,发展他们成为我们团队的成员,从而能最大限度的推广滞销农产品,更好的帮助农民朋友。但在海量的客户数据中,迅速有效的找到适合的群体,一般是十分困难的。不过目前的数据挖掘技术、云数据技术可以帮我们实现这个需求。我们基于客户的购买频次、金额、数量、价格敏感系数等多个系数指标,设计了一套可以进行目标客户聚合的客户细分系统。
4 用户细分系统设计
4.1 用户数据的整理
在数据挖掘的应用过程中,为了便于进一步的深度挖掘,首先要对数据进行整理。在我们设计系统的多个数据表中,各表多个元素之间有很多关联,数据冗余较多,所以,我们需要进行优化整理。橙光平台的数据库设计共有三个数据库,并作为数据挖掘的三层基本结构。例如:对于客户订单信息数据,包括有农产品信息数据、爱心公益型用户的信息、订单物流信息数据以及农产品订单数据等。首先进行第一层面的处理,就是把库中多个表格的数据进行整合,然后把上层的数据进行整合,并集成到一个表中作为第二层,且每一个表都需要将重点数据信息突显。在第三层中是用于数据的展示,方便数据的整合。针对各个维度,每一个都需要进行数据挖掘,以客户记录中订单数量(order_num)为例,通过以订单数作为主要的对象进行挖掘,可以把所有的客户数据通过订单数这个字段进行聚类,然后还可以分析其它维度信息,例如农产品大类的购买量和金额,从而去分析挖掘此客户作为公益发展代表的可能性。
4.2 数据聚类的数学模型
系统应该给所有需要的聚类都设计一个数学模型,然后再以模型为基础,求出相对应的数据集合。我们需要做的假定就是目标数据集由一系列概率分布的数据组成。我们通过设计一个数据分布模型来对分布情况进行描述,根据数学模型来寻找一个区域,以验证维度分析的可能性。对于数据分布比较分散且不利于数据的分析这种情况,可以判断维度的选择是不恰当的,反过来如果数据相对比较集中,则可以判断区域聚类是有效的。数学模型设定 X={X1,X2,…,Xn}是 n 维的一个立体模型,当中的 X1,X2,…,Xn 分别代表 n 维空间中单独的一个维度。数学模型设计的算法输入参数是 n 维空间中的点集合,其中 A={a1,a2,…,an}代表点集中。然后我们确定一个区域集,再确定好参数半径δ,如果点中心与点的距离在δ以内,就算作集合的组成项。设计的二维空间的距离计算公式如式1所示: 判断点 A={a1,a2,…,an}是否位于指定区间{b1,b2,…,bn}内,只要比较a的每个分量是否都满足距离中心距离小于参数δ。
4.3 客户细分的聚类
在客户进行细分时,所有类型客户的参数都可以进行自主调整,我们首先通过消费者的消费总额进行第一层面的聚类,可以得到一个核心的点为¥450的范围,然后设定范围半径为¥60,则可以得出此聚类范围的客户数量。在进行客户细分时,不只是通过购买的总额度作为唯一单独的维度,还将购买农产品总次数、价格敏感度、下单次数、区段时间内购买的频次等信息要素按系数比例整合,组成一个特有的爱心公益客户数据模型,再根据得出的数据结果进行客户的类型级别的划分。在我们目标客户群体中,以分析富有爱心的公益客户为主,可以发现多个不同情况的聚类。比如,按照交易的金额进行客户公益热衷度分类的聚类结果,如图1(a)所示。同时我们还设计了以交易频次作为分析对象,设置1-3次、4-6次、7-10次、10次以上作为维度分析的半径,分析结果如图1(b)所示。
通过对各个维度的因素设置合理的系数指标,我们将客户的聚类分析结果进行汇总,按既定范围将目标的客户分为三大类,结果如图2所示。从图中我们发现,公益性强的客户已基本从大量客户信息资源中脱颖而出,我们将进行下一步吸收扩展,从最后的效果上来看,成功的几率已比原来有大幅提高,证明了我们设计的客户细分系统在这一应用领域的有效性。
5 结语
橙光平台客户细分模块的设计实现,能有效的帮助我们在平台客户群体中快速找到并发展富有爱心的公益群里,能使我们的扶农项目在短期内达到理想的营销推广效果,对平臺而言是一个十分重要的功能。但是,由于开发设计的时间比较短,设计者的技术经验不足,此模块还有许多有待改进的地方。后期我们将不断完善这一模块的功能,并且将分析的维度进一步扩大,争取提高分析结果的准确性和合理性。而且,在此基础之上,未来我们还要将此技术应用的范围扩大至我们的客户服务这一领域,希望建设一个更好的平台为广大需要帮助的农民朋友和爱心客户服务。
参考文献
[1]张吉善,胡晓棠,尤惠.数据挖掘在电子商务中的应用[J].科技情报开发与经济, 2007,(6Z):268268.
[2]逄琳,刘方爱.基于层次划分的密度优化聚类算法[J].计算机应用,2016, 36(6).
[3]王硕.数据挖掘技术与电子商务关系分析[Z].大学生论文联合比对库,2015.
[4]侯俐至.SLA 驱动的 Paa S 平台资源管理的设计与实现[D].北京:北京邮电大学,2014.
关键词:数据挖掘;爱心志愿者;客户细分;维度分析;聚类分析
中图分类号:F49 文献标识码:A doi:10.19311/j.cnki.16723198.2018.05.037
1 引言
扶农电子商务平台是一种新兴商业模式,可以有效的帮助农民朋友解决滞销、掉价等伤农问题。但在我国现阶段从事扶农电子商务的公司中,业务模式缺乏创新、效果不理想、经营目的缺乏社会公益性、技术相对落后等问题比较突出。橙光扶农平台的基于志愿者公益性推广模式,无疑是这一领域的一次新的尝试。平台把一些诸如数据挖掘和云计算等最新先进技术植入到电子商务平台中来。虽然这些技术还在不断的研究改进,但对于电商龙头阿里巴巴等大公司,这些技术已经应用于公司的数据分析与商业模式研究,但没有全面的为个人用户服务。中国电子商务目前依托集约化平台的现象十分普遍,比如淘宝、京东等,基本没有自己独立的客户分析系统,这对于企业长远的发展是不利的,电商市场急需有数据挖掘和云计算功能植入的独立系统平台。
2 国外发展研究现状
由于国外许多电子商务平台发展比较早,也成为我国电子商务行业發展早期的主要参照。他们的数据挖掘、云计算等技术也比我国研究应用的早,也已经有了相对成熟的研究模式和成果,并且早已经将这些成熟的技术应用到了电子商务领域。其中Amazon就是其中的佼佼者,其在电子商务领域不但成了一方霸主,同时也是云计算的最早引领者,数据挖掘与云计算已经成了其主要业务之一。科学技术正在领导世界社会的进步,例如谷歌的无人驾驶汽车、三星视网膜识别技术都在改变着整个世界格局。数据挖掘技术在企业信息系统中的广泛应用已经是整个行业发展的必然,技术不但能提升了自身产品的含金量和竞争力,同时还可以扩展公司的业务范围,帮助企业获取更多的利润源。
3 橙光扶农平台客户细分系统的需求分析
3.1 橙光扶农平台建设背景
近年来,我国农产品滞销现象层出不穷,伤农损农显现不断出现。一边是市民抱怨农副产品价格大涨,一边是农民种植的产品低价贱卖、血本无归。分析这一怪相的原因有很多,比如:中间商垄断收购、压仓抬价;物流不畅、物流成本高;农民无规划盲目种植、造成市场供过于求;一家一户的分散种植经营模式,造成农产品滞销、难卖等等。原因很复杂,但总归有一点基本的问题就是市场供求信息流通不畅,解决的方法之一就是建设高效的信息平台,帮助农民和消费者之间搭建无障碍的信息沟通的桥梁。橙光计划的主要业务目标就是通过建设的电子商务系统平台帮助农户宣传、销售农产品,解决农户农产品滞销这一最大的困难。扶农平台通过搭建供销信息平台“基地+平台+消费者”的现代产销体系,减少中间环节,减少时间地理带来的经济损失,引导农户直接和市场对接。通过自建的电子商务交易平台加强农产品市场信息的发布,拓宽农产品销售渠道,建设农户直通消费者的网络直销平台,帮助滞销的农户销售出农产品。
3.2 客户细分的目的与需求
橙光平台是以公益志愿者为主参与滞销农产品公益推广的运作模式。通过了解,我们发现大部分地区的农户想要尝试新的办法销售出农产品,但是又怕费力不讨好,让辛苦培育出的农产品销售不出或者自己亏本。平台从全国各地招募志愿者,家在滞销地区的在校大学生、非滞销地区的大学生、社会爱心人士等,家在滞销地区的在校大学生更能清楚的了解滞销地区的农产品情况,组织志愿者走进农户,了解农户农产品的销售情况,向农户推广电子商务平台,普及扶农平台相关信息知识,了解市场情况,获得信任,从而帮助他们销售农产品。让农户愿意相信我们并愿意尝试通过我们的扶农平台销售他们的农产品。
对于橙光平台,基于公益的推广模式的重要环节是从全国大量的客户资源中,细分出能够成为我们公益推广使者的客户群,发展他们成为我们团队的成员,从而能最大限度的推广滞销农产品,更好的帮助农民朋友。但在海量的客户数据中,迅速有效的找到适合的群体,一般是十分困难的。不过目前的数据挖掘技术、云数据技术可以帮我们实现这个需求。我们基于客户的购买频次、金额、数量、价格敏感系数等多个系数指标,设计了一套可以进行目标客户聚合的客户细分系统。
4 用户细分系统设计
4.1 用户数据的整理
在数据挖掘的应用过程中,为了便于进一步的深度挖掘,首先要对数据进行整理。在我们设计系统的多个数据表中,各表多个元素之间有很多关联,数据冗余较多,所以,我们需要进行优化整理。橙光平台的数据库设计共有三个数据库,并作为数据挖掘的三层基本结构。例如:对于客户订单信息数据,包括有农产品信息数据、爱心公益型用户的信息、订单物流信息数据以及农产品订单数据等。首先进行第一层面的处理,就是把库中多个表格的数据进行整合,然后把上层的数据进行整合,并集成到一个表中作为第二层,且每一个表都需要将重点数据信息突显。在第三层中是用于数据的展示,方便数据的整合。针对各个维度,每一个都需要进行数据挖掘,以客户记录中订单数量(order_num)为例,通过以订单数作为主要的对象进行挖掘,可以把所有的客户数据通过订单数这个字段进行聚类,然后还可以分析其它维度信息,例如农产品大类的购买量和金额,从而去分析挖掘此客户作为公益发展代表的可能性。
4.2 数据聚类的数学模型
系统应该给所有需要的聚类都设计一个数学模型,然后再以模型为基础,求出相对应的数据集合。我们需要做的假定就是目标数据集由一系列概率分布的数据组成。我们通过设计一个数据分布模型来对分布情况进行描述,根据数学模型来寻找一个区域,以验证维度分析的可能性。对于数据分布比较分散且不利于数据的分析这种情况,可以判断维度的选择是不恰当的,反过来如果数据相对比较集中,则可以判断区域聚类是有效的。数学模型设定 X={X1,X2,…,Xn}是 n 维的一个立体模型,当中的 X1,X2,…,Xn 分别代表 n 维空间中单独的一个维度。数学模型设计的算法输入参数是 n 维空间中的点集合,其中 A={a1,a2,…,an}代表点集中。然后我们确定一个区域集,再确定好参数半径δ,如果点中心与点的距离在δ以内,就算作集合的组成项。设计的二维空间的距离计算公式如式1所示: 判断点 A={a1,a2,…,an}是否位于指定区间{b1,b2,…,bn}内,只要比较a的每个分量是否都满足距离中心距离小于参数δ。
4.3 客户细分的聚类
在客户进行细分时,所有类型客户的参数都可以进行自主调整,我们首先通过消费者的消费总额进行第一层面的聚类,可以得到一个核心的点为¥450的范围,然后设定范围半径为¥60,则可以得出此聚类范围的客户数量。在进行客户细分时,不只是通过购买的总额度作为唯一单独的维度,还将购买农产品总次数、价格敏感度、下单次数、区段时间内购买的频次等信息要素按系数比例整合,组成一个特有的爱心公益客户数据模型,再根据得出的数据结果进行客户的类型级别的划分。在我们目标客户群体中,以分析富有爱心的公益客户为主,可以发现多个不同情况的聚类。比如,按照交易的金额进行客户公益热衷度分类的聚类结果,如图1(a)所示。同时我们还设计了以交易频次作为分析对象,设置1-3次、4-6次、7-10次、10次以上作为维度分析的半径,分析结果如图1(b)所示。
通过对各个维度的因素设置合理的系数指标,我们将客户的聚类分析结果进行汇总,按既定范围将目标的客户分为三大类,结果如图2所示。从图中我们发现,公益性强的客户已基本从大量客户信息资源中脱颖而出,我们将进行下一步吸收扩展,从最后的效果上来看,成功的几率已比原来有大幅提高,证明了我们设计的客户细分系统在这一应用领域的有效性。
5 结语
橙光平台客户细分模块的设计实现,能有效的帮助我们在平台客户群体中快速找到并发展富有爱心的公益群里,能使我们的扶农项目在短期内达到理想的营销推广效果,对平臺而言是一个十分重要的功能。但是,由于开发设计的时间比较短,设计者的技术经验不足,此模块还有许多有待改进的地方。后期我们将不断完善这一模块的功能,并且将分析的维度进一步扩大,争取提高分析结果的准确性和合理性。而且,在此基础之上,未来我们还要将此技术应用的范围扩大至我们的客户服务这一领域,希望建设一个更好的平台为广大需要帮助的农民朋友和爱心客户服务。
参考文献
[1]张吉善,胡晓棠,尤惠.数据挖掘在电子商务中的应用[J].科技情报开发与经济, 2007,(6Z):268268.
[2]逄琳,刘方爱.基于层次划分的密度优化聚类算法[J].计算机应用,2016, 36(6).
[3]王硕.数据挖掘技术与电子商务关系分析[Z].大学生论文联合比对库,2015.
[4]侯俐至.SLA 驱动的 Paa S 平台资源管理的设计与实现[D].北京:北京邮电大学,2014.