论文部分内容阅读
随着我国通信行业的不断发展,一直以来,移动、联通、电信三家运营商用尽一切手段争夺现有市场的用户资源,竞争相当激烈。随着互联网的迅速发展,海量用户通信信息、流量消费信息、业务消费信息等行为数据变得可得,这为数据挖掘技术的展开提供了更广阔的平台,哪个运营商能够更快、更准确、更有效地获取用户需求,哪个运营商就能赢得商机,就能在市场中处于优势地位。基于消费者行为数据的挖掘有助于运营商更好地开展精准营销、客户流失预警、潜在客户识别和黑名单用户识别等业务,从而提高客户满意度,加强运营商的竞争力,从而制定针对性的营销策略实现企业的精确营销,为不同的用户需求制定个性化方案提供依据,最终实现节约用户营销成本、提升企业利润的目的。但客户的行为数据挖掘面临如数据量巨大、数据类型多样等问题的困扰,传统的数据挖掘手段很难取得满意的效果。本文根据运行商用户消费行为特点,对联通大王卡业务的实证数据进行了数据预处理、描述性分析,主成分分析优化特征工程,并采用方差分析进行特征选取,再使用随机森林和Xgboost算法来训练用户数据,并确定模型的优化方案,进行了参数优化,最终对两种算法的模型表现进行了评价与对比,发现Xgboost算法的分类效果更好,最后对Xgboost算法的结果进行了分析展示。