3G时代客户识别数据挖掘模型及实证研究

来源 :中国电子商情 | 被引量 : 0次 | 上传用户:hoooopy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  引言:本文对3G时代用户的细分方法和3G目标市场的定位作了初步的研究,提出了3G时代客户识别数据挖掘模型,并采用BP神经网络和决策树对该模型进行验证,最后研究了3G目标市场定位考虑的要素和初步的建议。
  一、3G用户细分体系架构
  用户细分是3G业务开发及市场营销的基础,用户细分能够使差异化成为可能,使运营商提供的3G产品和服务能够更有针对性。3G用户细分方法的选择直接决定了相关用户细分结果的准确性及实用性。对于3G用户细分的体系搭建的思路是: 采用3 个纬度进行用户的细分,首先按照用户价值纬度进行用户细分,然后再结合消费行为纬度和消费心理纬度细分用户群。在3G用户细分的体系架构中,3个纬度的用户细分依据、方法及应用价值如表1 所示。
  二、客户识别分类模型
  (一)数据抽取
  本案例数据来源于某电信运营公司,该数据总量为26000条。每一条对应一个客户近六个月的统计信息。其中已知分类(2G、3G)的为18000条,未知分类8000 条。其中包括客户年龄,月平均消费额,月平均通话时长等属性250 个(包括客户类型)。本例利用26000条已知分类的数据进行分类模型的建立,随机抽取训练数据10000条,测试数据8000条。
  (二)数据预处理
  上述采集的数据有数据多、数据取值范围广和数据取值类型多样的特点,因此必须在建模前对数据进行预处理,如采集的样本数据存在一些属性值缺省或空值,如果不做处理,将直接影响后续算法的挖掘效果,严重时甚至得到错误的结果。数据预处理包含数据清洗、属性筛选、数据平衡、数据归一化和离散化五个步骤。数据清洗分为类型转换和缺失数据填补两部分;属性筛选分为人工筛选和通过相关系数分析实现属性选择两部分;由于作为训练的18000条数据只有少数是3G用户,这样会导致模型输出结果偏向判别为2G 客户,因此必须通过数据平衡实现2、3G用户数量达到1:1;为了提高BP 神经网络的性能,需要对数据进行归一化;对于决策树算法,需要对数据进行离散化,否则生产的决策树将会过于茂盛,以至于无法分析。
  三、客户数据分类识别过程
  本文分别采用BP 神经网络和决策树进行建模,实现对3G 客户的分类识别。本案例运用TipDM 数据挖掘在线建模平台中的性分析进行数据探索,再运用BP 神经网络和C4.5 决策树进行客户识别。(一)模型输入。本案例中,模型数据涉及客户年龄、月平均通话时长和月平均消费额等240多个属性(包含客户类型),模型输入需将客户识别样本属性表导入建模平台中即可。(二)仿真识别过程。建模仿真过程说明如下:1.登录TipDM 平台,在方案管理页面中,新建方案或者打开一个已建方案;2.切换到数据管理页面,上传经预处理后的专家样本数据文件;3.选择相关性分析功能,导入样本数据进行相关性分析;4.分别选择BP 神经网络算法和C4.5 决策树算法,进行模型构建;5.对比BP 神经网络和C4.5 决策树的建模结果,并选择最优算法;6.用最优法对测试样本进行3G 客户识别。(三)仿真结果分析。1.基于BP 神经网络的模型构建。由于神经网络算法输出结果受到训练次数影响,并伴随一定的随机性,多次实验得到的分类正确率如下表所示。
  四、总结与建议
  决策树与BP神经网络对于3G客户的识别正确率都接近80%,说明本用例建立的分类模型对3G客户的敏感度比较高,基本能识别出3G用户,能达到预期目标。但是只看3G客户的识别正确率是不科学的,还要看2G 客户的识别正确率和总体识别正确率。从总体正确率看,BP 神经网络的正确率仍然比决策树高近10%,BP神经网络无论是总体性能还是对局部分类的敏感度都表现不错,而决策树分类模型性能还有待提高。
  虽然本例的客户识别未能达到百分百地准确,但从另外一个角度看,一味追求正确率并没有太多意义。因为本来运营商对各个用户的类别就已经作了登记,反而,我们或许能从客户的误识别中获得更多信息。
  本来是2G客户,但被识别为3G客户的用户很有可能就是因为它的各项属性与3G客户的相似,如月均网络游戏游流量比较大,月均消费额较高,说明这部分人客户是有机会被发展成3G客户,电信运营商应对这批客户大力推销3G应用;而部分3G客户被识别为2G客户,很有可能是因为对目前的3G资费或3G服务不满意的客户,他们对3G应用并不感兴趣,因此和3G用户的特征不相符,这部分客户很有可能在未来几个月内会流失,所以,电信运营商应更加关注这批客户的情况,争取减少客户的离网率。
  (作者单位:山西移动通信有限公司朔州分公司)
其他文献
引言  随着互联网的成熟和移动互联网的迅速成长与发展,以及越来越多的智能移动设备的普及,必将出现一系列的创新服务使得人民的生活有巨大的变化。如何将移动技术应用于企业移动管理方面,为企业移动管理提供服务和解决方案,提高企业内部人员的工作效率,这是一个非常值得研究的课题。论文的主要工作是基于LBS技术[1],分析相关企业的行业需求,设计并开发一个可供企业实现内部员工和领导相互沟通的信息监控系统。协助企
期刊
引言:随着社会的不断发展与进步,重视机电设备安装工程中的施工技术具有重要的意义。本文主要探讨机电设备安装工程中的施工技术中的有关内容。  1.设备安装施工程序  1)设备开箱清点并记录2)设备基础检查验收。3)设备基础放线。4)设备就位。5)找平找正。6)灌浆固定。7)设备零部件安装。8)润滑与加油。9)设备单机调试与系统联合试运转。10)竣工验收。  2.设备开箱清点及记录  设备到货后,由安装
期刊
引言:电网是社会经济发展中最为重要的基础设施之一,近年来,电网负荷的增长速度很快,大的区域电网互联已经形成,电力市场运行对电网运行渐渐的造成影响,在加上全球气候的影响,对电网安全稳定的运行提出了很大的考验。电力工程技术的应用,对于促进智能化电网的建设,优化能源结构以及提高经济效益具有重要作用。  一、智能电网的概念和发展趋势  智能电网是电网现代化的产物。智能电网用电力和信息技术将电源及用户相互联
期刊
引言:第二次土地调查中,MapGIS广泛应用与城镇地籍调查数据库建设中。本文结合作业实际状况,针对MAPGIS软件平台,对数据入库的方法和流程、数据控制方法进行探讨。并对在数据库的建设中的一些问题做出具体的解决方法。提高了土地资源管理的现代化水平。  城镇土地数据库建设是第二次土地调查中城镇地籍调查的重要组成部分。笔者在作业过程中,总结出一套有效的作业方式和质量控制方法,很好的解决了建立数据库中的
期刊
引言:随着信息化社会的不断发展和完善,高校档案管理工作也面临着一系列的挑战,新形势下高校档案管理工作也需要与时俱进,加大创新力度。高校档案管理工作是高校事业发展的重要工作之一,特别是高校的档案管理错综复杂,更要讲究管理上的方法与创新工作。本文主要从四个方面进行创新策略构建,一是高校档案信息的数字化建设,二是高校档案管理的信息化建设,三是高校档案管理的文档一体化建设,四是加强档案信息资源的全面整合。
期刊
引言:本文系统的介绍了MasterCAM软件加工所用文字模型的建立,详细讨论了基于软件的多种雕刻方式和实现方法。  随着科技的发展,计算机技术的日益成熟,MasterCAM软件雕刻加工技术得到普遍应用。但在实际应用中还有许多方面亟待提高,笔者通过多年经验总结了几点MasterCAM软件的应用经验,希望对业内同行有所帮助。  MasterCAM 是目前国内外工业企业广泛使用的CAD/CAM集成软件,
期刊
引言:电子商务服务平台是网络效应理论的一个实际证明。在线销售商品的数量远远大于实体商店的商品种类和数量,这一优势吸引了更多的互联网用户来网站进行商品检索,因此为网站带来了流量。本文通过阿里巴巴和卓越亚马逊的对比中分析电子商务在中国的发展,找出推动中国电子商务发展背后的根本动力,为中国电子商务的发展提供理论指导。  一、比较阿里巴巴和卓越亚马逊分别在中国运营的特点和优劣分析  不同的电子商务企业对商
期刊
引言:随着电子技术的不断发展,越来越多的电子技术开始被应用于企业的档案管理中。通过电子管理,可以利用各种电子设备和技术,将企业传统的纸质档案进了合理的转换,使之更利于保存和使用。本文,我们即从档案电子管理的含义入手,分析企业档案电子化管理的作用,以及目前我国企业档案管理电子化的现状及问题。并积极寻找可行措施来加强企业档案电子化管理。  电子管理是对企业档案管理的重大改革,代表了企业档案管理的发展方
期刊
引言:现如今计算机技术水平持续上升,发展迅猛,而教育考试形式也因此突破传统形式,不在局限于手写,直接利用多媒体网络技术在线参加考试。本文首先简单介绍了广泛应用于在线考试系统里的多媒体技术,主要针对Asp具体分析,再研究其系统性的开发模式,并具体阐述其主要实现的应用。  我国经济实力的增强,文化水平的提高,使得现代化技术的应用范围越来越广泛,人们对多媒体技术的应用也愈加普及化,网络像一张网覆盖全球,
期刊
引言:如今,网络技术迅猛发展,互联网作为传播信息的新媒体,越来越多成为当代大学生获取知识和信息的新途径,对广大大学生的学习、生活乃至思想观念产生着广泛而又深刻的影响。本文分析了互联网对当代大学生的多方面影响,并就这些影响提出了解决对策。  21世纪是信息技术与网络高速发展的时代,互联网已经渗透到社会生活的各个领域,影响着人类的生活和思维方式,作为社会主义现代化建设生力军的大学生,网络正在极大地影响
期刊