论文部分内容阅读
移动通信行业的发展和移动互联网行业的繁荣吸引了越来越多的企业。市场竞争日益激烈,使得许多企业都存在不同程度的用户流失现象。通过数据挖掘的方法,对企业拥有的大量用户数据进行分析,能够获得流失用户的数据特征,并依据这些特征做出相应的商业决策,以减少用户的流失。用户流失预警成为企业实施用户管理的重要方面。目前,解决用户流失预警问题的方法理论已经比较成熟,本文在已有研究的基础上,选取不同的用户属性,对用户流失预警问题进行了研究。使用带有聚类辅助的决策树算法,完成了用户流失预警问题的研究。主要内容如下:首先,使用聚类算法对用户数据进行了分析。聚类算法能够对数量庞大的用户数据进行无监督分类。通过对用户数据进行聚类分析,得出了流失用户主要集中的类别,以及这些类别的一些数据特征。对聚类结果的分析为筛选研究价值更高的用户数据进行决策树建模提供了依据。其次,使用决策树算法对用户流失预警问题进行了研究,构建了用户流失预警的决策树模型。在聚类分析的基础上,整理筛选出用于构建决策树模型的样本数据以及用于模型验证的测试数据。按照数据挖掘的标准流程,合并研究价值较高的类别下的用户数据,执行决策树算法,得到用户流失的决策树预警模型。随后,本文还对模型进行了评估,从准确率、提升度方面验证了已得到的决策树模型具有良好的用户流失预警功能。最后,根据用户流失预警模型设计了预警系统的基本框架。对于已经构建的模型,需要经过实际应用才能发现新的问题。本文依据数据挖掘的流程,结合数据仓库技术,完成了用户流失预警系统的逻辑设计、功能设计以及模块设计。系统设计的同时,还考虑了系统的可扩展性。本文选取了多个类别的用户数据进行研究。样本数据来源于某运营商的用户数据。为保证用户数据的时效性,本文设定了时间窗口,所有用户数据均生成于设定的时间窗口之内。除了包含用户的通话信息、区域信息等基本信息之外,还加入了用户的上网流量信息,并将流量信息作为用户的重要属性进行研究。将用户流量信息在时间窗口之内的统计特征作为新的用户属性,用于构建模型。本文对移动互联网环境下的用户流失预警问题进行了一定的研究,构建的决策树模型具有较好的预测能力。同时设计了用户流失预警系统的基本结构,具有一定的使用价值。