论文部分内容阅读
随着计算机技术特别是数据库技术的广泛应用,各行各业积累了海量的数据。但是出现了数据丰富但信息贫乏的现象,数据密集型企业越来越认可数据挖掘的重要性。数据挖掘技术的应用研究越来越广泛,其中在电信行业中的应用就是一大焦点。基于数据挖掘的电信客户WLAN业务订购预测这项研究,是在数据仓库和数据挖掘技术迅猛发展的基础上,针对电信企业客户关系管理的迫切需要,为了扩大运营商的WLAN客户规模而设计提出的。本文工作以K市“中国移动通信公司数据挖掘及数据分析服务”项目为背景,将数据挖掘技术应用到电信企业的WLAN业务推广活动中。依托K市移动通信公司经营分析系统中客户数据,以CRISP-DM方法论为建模过程框架,按照商业理解、数据理解、数据准备、模型建立、模型评估、模型部署的步骤,利用数据挖掘工具SPSS Clementine设计和实现了电信客户WLAN业务订购预测模型。本文首先介绍了数据挖掘的相关理论知识。在模型建立以前,对数据进行了有效的集成、规约、清理、转换、探索等工作,处理了不平衡数据集,结合行业经验初步确定了建模使用的样本集和属性指标。最终建立了决策树C5.0、CART分类回归树、二项Logistic回归分析三类模型,通过对三类模型进行多次训练和多项指标的评估,最终选择了最优属性和最佳模型应用于电信客户WLAN业务订购预测研究。在模型部署阶段,初步分析了客户业务订购原因,并根据预测模型给出的客户得分情况,对得分较高者进行业务推广,从而扩大用户规模。应用结果表明所建立的模型是科学的,基本上符合实际情况,能够给决策人员提供有价值的预测信息并给出相应的解决方案,该预测研究对电信运营商扩大WLAN客户规模具有重要意义。