论文部分内容阅读
2013年12月4日工信部正式向三大运营商发布TD-LTE 4G牌照,2015年2月27日,工业和信息化部向中国电信和中国联通发放FDD-LTE经营许可。业内普遍认为,在3G时代扭转的三大运营商竞争格局,也许会在即将到来的4G时代被再次打破。在4G发牌后,三大运营商重新站在了同一起跑线上。4G市场将是一个更大的蛋糕,三大运营商谁能在新的竞争中抓住最佳的市场机遇,谁就能获益其中。2016年国家提速降费持续推进,全年互联网业务加速增长。从长期来看,随着信息技术的升级换代,网络成本逐步下降,基础电信企业提速降费将成为常态。从用户需求来看,用户对高带宽的需求越来越大,高带宽用户占比将持续快速提高,移动数据流量也将继续加速增长。
导致国内电信业用户流失的现象非常严重的主要因素有以下几点:
市场竞争因素。从三家运营商公布的数据看,全国移动业务用户已达13亿户,多数城市移动电话渗透率超过100%,新增市场空间非常有限,国内市场己经趋于饱和。因此,客户资源的竞争成为运营商的首要任务。
通信技术更新因素。在移动电话兴起前,用户通信主要以固定电话为主,市场空间很大,客户流失极少。如今,随着科技的发展,各种通信技术的发明,产生出一系列新产品,供用户选择的范围更加广泛。随着客户消费水平的提高,理性消费趋于主流。客户更多的根据自己的偏好、资费等因素选择运营商。
同质化业内竞争。虽然各通信运营商采用不同的技术,但是提供的服务都是语音业务及数据业务为主。因此,对用户来说选择哪个运营商,所获得的使用价值差别不是很大。在这种情况下,用户比较容易流失。
低ARPU值群体增加。随着电信市场的饱和,开始涌入大量低端用户。很多用户都有两个以上运营商的号码在用,或者是同一运营商的两个号码,一个为主另一个为辅,产生很多ARPU值较低的用户号码,低ARPU值用户对资费的高敏感度导致离网率不断上升。
受到营改增、成本压降、实名制等宏观政策的影响。例如营改增及成本压降后,中国联通成本转换空间较小,只能刚性压缩终端补贴成本和佣金等营销成本,直接影响了社会渠道的盈利和发展能力,之前靠社会渠道粗广的“大进大出”的营销模式带来的增量用户手段已经不适用现行的市场环境,中国联通社会渠道业务发展比重在三家运营商中占比最高,实名制实施后,对中国联通移动业务发展影响极大。
所以运营商需要寻找更有效的办法来保持与客户的关系,创造价值和维系用户,增加盈利。如何尽早发现客户的流失倾向并进行有针对性的维系对于企业的发展举足轻重。
数据挖掘技术是预测客户流失最常用的方法。其目的是对大量的数据进行各种处理,从中提取出隐含在数据中的知识。在预测客户流失时,可利用其决策树、神经元网络、分类回归树等手段建立预测客户流失倾向的模型,通过模型从大量的客户数据中提取对预测客户流失有用的信息,据此信息制订相关的客户维系工作计划。由于电信行业的数据库数据量极大,而且数据中的数据并不能直接用于数据挖掘。因此,将数据挖掘技术应用于电信行业时,需要注意电信行业某些业务有别于其他行业的特点。
在电信行业中,数据挖掘技术一般应用于以下几个方面:
(1)客户消费模式分析。通过分析客户的通话时段、不同职业客户的通话特征、缴费周期、使用网络服务的规律、套餐饱和度等,为电信行业的经营决策提供依据。
(2)新产品推广分析。在电信行业推广其新产品时,利用数据挖掘技术分析推广活动中存在的问题,据此分析结果调整其推广策略,以达到最佳的推广效果。
(3)客户欠费分析。通过数据挖掘技术,发现客户欠费行为的规律,当客户在某一时间段内的话费规律与欠费规律相似时,数据挖掘系统提出警示,以便工作人员采取相关措施,将企业的风险和损失降至最低。 (4)客户流失分析。根据己流失客户的数据,找出客户相关属性、客户消费行为等数据与客户流失之间的内在关系,并建立这种关系的数据模型。然后监控在网客户中与流失客户相关的数据属性,当某些属性与客户流失模型吻合时,向工作人员提出预警。工作人员据此报告采用相应的维系手段来提高客户的忠诚度,降低客户的流失率。
由于客户数据的一些特点,使得将数据挖掘技术用于电信客户关系管理时将会面臨以下几个较具挑战性的问题。
(1)数据准备工作时间长:由于原始客户数据量大、时间跨度长、业务流程发生变化等,在进行数据挖掘工作前,需要对这些原始数据依次进行选择、格式化、清洗、整合以及重建的工作,导致在数据准备这一环节的工作量非常大。有相关研究指出,在数据挖掘过程中,数据准备这一过程一般花费整个数据挖掘过程50%-80%的时间。
(2)预测模型数据集的建立:在进行客户流失预测时,如果直接采用某种预测模型,比如神经元网络模型、分类回归树、决策树等,那么最终的预测结果将是无效的。因为利用原始客户数据建立预测模型集时,流失客户在客户数据库中过少,导致流失客户的样本特征不具有代表性。一般解决方案是提高流失客户在客户数据库中的比例,但是这种方法也会产生潜在的负面影响。
(3)数据挖掘结果与实际情况不吻合:电信行业客户数据库中,由于客户众多,导致客户数据量大。而且随着技术的发展和业务流程的变化,导致数据的正确性、完整性以及一致性也会发生变化。从而使得利用历史数据分析出来的结果与实际情况存在不吻合的情况。
(4)采用数据挖掘技术的成本效益:当需要耗费大量的人力和物力进行数据挖掘后,数据挖掘的预测结果不是非常理想,则会使得将数据挖掘技术用于客户流失预测的成本效益过低。此外,如果进行客户维系的成本过高,即使数据挖掘的结果很理想,也会导致数据挖掘技术失去实际意义。
目前常用的数据挖掘方法有很多,从国内相关研究来看,客户流失分析较为常用的有四种方法,分别是决策树方法、贝叶斯分类方法、神经元网络方法和Logistic回归方法。
使用以上几种数据挖掘方法建立模型并应用于市场分析,可有效的预测未来即将流失或有流失风险的用户数据,尤其是高ARPU值用户。客户一旦离网,重新回流的难度和成本就非常高了,因此必须要在客户离网之前,提前发现客户的离网倾向,更重要的是需要找出这些客户离网的原因,从而有针对性的进行客户维系工作和开展新的营销计划,因此,建立数据挖掘模型必须在发现客户离网倾向的同时,能够提供对客户离网行为的解释,帮助找出客户离网的内在原因。为了能够有效的提前做好防止客户离网的工作,建立数据挖掘预测模型应该能够讲求效率,所以对预测的时效性要求也比较高,不能耗费过多的时间在模型的建立和训练上,需要尽可能早发现客户的离网倾向尽早的拿出维系挽留措施,降低流失风险,这样在当今竞争激烈的通信市场环境下,能新发展用户的同时又能最大限度的维系在网老客户是运营商保持市场及收入份额的关键。
作者简介:闫飞(1980.03—),男,籍贯:陕西,学校:内蒙古科技大学,学历:硕士,院系:信息工程学院,专业:计算机技术,研究方向:基于数据挖掘技术的电信行业3G用户流失分析研究。
导致国内电信业用户流失的现象非常严重的主要因素有以下几点:
市场竞争因素。从三家运营商公布的数据看,全国移动业务用户已达13亿户,多数城市移动电话渗透率超过100%,新增市场空间非常有限,国内市场己经趋于饱和。因此,客户资源的竞争成为运营商的首要任务。
通信技术更新因素。在移动电话兴起前,用户通信主要以固定电话为主,市场空间很大,客户流失极少。如今,随着科技的发展,各种通信技术的发明,产生出一系列新产品,供用户选择的范围更加广泛。随着客户消费水平的提高,理性消费趋于主流。客户更多的根据自己的偏好、资费等因素选择运营商。
同质化业内竞争。虽然各通信运营商采用不同的技术,但是提供的服务都是语音业务及数据业务为主。因此,对用户来说选择哪个运营商,所获得的使用价值差别不是很大。在这种情况下,用户比较容易流失。
低ARPU值群体增加。随着电信市场的饱和,开始涌入大量低端用户。很多用户都有两个以上运营商的号码在用,或者是同一运营商的两个号码,一个为主另一个为辅,产生很多ARPU值较低的用户号码,低ARPU值用户对资费的高敏感度导致离网率不断上升。
受到营改增、成本压降、实名制等宏观政策的影响。例如营改增及成本压降后,中国联通成本转换空间较小,只能刚性压缩终端补贴成本和佣金等营销成本,直接影响了社会渠道的盈利和发展能力,之前靠社会渠道粗广的“大进大出”的营销模式带来的增量用户手段已经不适用现行的市场环境,中国联通社会渠道业务发展比重在三家运营商中占比最高,实名制实施后,对中国联通移动业务发展影响极大。
所以运营商需要寻找更有效的办法来保持与客户的关系,创造价值和维系用户,增加盈利。如何尽早发现客户的流失倾向并进行有针对性的维系对于企业的发展举足轻重。
数据挖掘技术是预测客户流失最常用的方法。其目的是对大量的数据进行各种处理,从中提取出隐含在数据中的知识。在预测客户流失时,可利用其决策树、神经元网络、分类回归树等手段建立预测客户流失倾向的模型,通过模型从大量的客户数据中提取对预测客户流失有用的信息,据此信息制订相关的客户维系工作计划。由于电信行业的数据库数据量极大,而且数据中的数据并不能直接用于数据挖掘。因此,将数据挖掘技术应用于电信行业时,需要注意电信行业某些业务有别于其他行业的特点。
在电信行业中,数据挖掘技术一般应用于以下几个方面:
(1)客户消费模式分析。通过分析客户的通话时段、不同职业客户的通话特征、缴费周期、使用网络服务的规律、套餐饱和度等,为电信行业的经营决策提供依据。
(2)新产品推广分析。在电信行业推广其新产品时,利用数据挖掘技术分析推广活动中存在的问题,据此分析结果调整其推广策略,以达到最佳的推广效果。
(3)客户欠费分析。通过数据挖掘技术,发现客户欠费行为的规律,当客户在某一时间段内的话费规律与欠费规律相似时,数据挖掘系统提出警示,以便工作人员采取相关措施,将企业的风险和损失降至最低。 (4)客户流失分析。根据己流失客户的数据,找出客户相关属性、客户消费行为等数据与客户流失之间的内在关系,并建立这种关系的数据模型。然后监控在网客户中与流失客户相关的数据属性,当某些属性与客户流失模型吻合时,向工作人员提出预警。工作人员据此报告采用相应的维系手段来提高客户的忠诚度,降低客户的流失率。
由于客户数据的一些特点,使得将数据挖掘技术用于电信客户关系管理时将会面臨以下几个较具挑战性的问题。
(1)数据准备工作时间长:由于原始客户数据量大、时间跨度长、业务流程发生变化等,在进行数据挖掘工作前,需要对这些原始数据依次进行选择、格式化、清洗、整合以及重建的工作,导致在数据准备这一环节的工作量非常大。有相关研究指出,在数据挖掘过程中,数据准备这一过程一般花费整个数据挖掘过程50%-80%的时间。
(2)预测模型数据集的建立:在进行客户流失预测时,如果直接采用某种预测模型,比如神经元网络模型、分类回归树、决策树等,那么最终的预测结果将是无效的。因为利用原始客户数据建立预测模型集时,流失客户在客户数据库中过少,导致流失客户的样本特征不具有代表性。一般解决方案是提高流失客户在客户数据库中的比例,但是这种方法也会产生潜在的负面影响。
(3)数据挖掘结果与实际情况不吻合:电信行业客户数据库中,由于客户众多,导致客户数据量大。而且随着技术的发展和业务流程的变化,导致数据的正确性、完整性以及一致性也会发生变化。从而使得利用历史数据分析出来的结果与实际情况存在不吻合的情况。
(4)采用数据挖掘技术的成本效益:当需要耗费大量的人力和物力进行数据挖掘后,数据挖掘的预测结果不是非常理想,则会使得将数据挖掘技术用于客户流失预测的成本效益过低。此外,如果进行客户维系的成本过高,即使数据挖掘的结果很理想,也会导致数据挖掘技术失去实际意义。
目前常用的数据挖掘方法有很多,从国内相关研究来看,客户流失分析较为常用的有四种方法,分别是决策树方法、贝叶斯分类方法、神经元网络方法和Logistic回归方法。
使用以上几种数据挖掘方法建立模型并应用于市场分析,可有效的预测未来即将流失或有流失风险的用户数据,尤其是高ARPU值用户。客户一旦离网,重新回流的难度和成本就非常高了,因此必须要在客户离网之前,提前发现客户的离网倾向,更重要的是需要找出这些客户离网的原因,从而有针对性的进行客户维系工作和开展新的营销计划,因此,建立数据挖掘模型必须在发现客户离网倾向的同时,能够提供对客户离网行为的解释,帮助找出客户离网的内在原因。为了能够有效的提前做好防止客户离网的工作,建立数据挖掘预测模型应该能够讲求效率,所以对预测的时效性要求也比较高,不能耗费过多的时间在模型的建立和训练上,需要尽可能早发现客户的离网倾向尽早的拿出维系挽留措施,降低流失风险,这样在当今竞争激烈的通信市场环境下,能新发展用户的同时又能最大限度的维系在网老客户是运营商保持市场及收入份额的关键。
作者简介:闫飞(1980.03—),男,籍贯:陕西,学校:内蒙古科技大学,学历:硕士,院系:信息工程学院,专业:计算机技术,研究方向:基于数据挖掘技术的电信行业3G用户流失分析研究。