论文部分内容阅读
随着电信市场的逐渐放开,电信企业之间对客户的争夺将越来越激烈。由于电信市场日趋饱和,获取新客户的成本比留住现有客户要昂贵得多。因此,如何尽可能将现有客户尤其是高价值客户保留在自己的网上成了各运营商的工作重点之一。通过建立客户离网模型,使企业能根据对以往离网客户的消费情况进行分析,找出即将离网客户的特征,及时采取相应的措施,减少客户离网的发生。因此,客户流失分析研究对企业降低运营成本,提高经营业绩有着极为重要的意义。
本文的应用背景为南京市网通小灵通用户,取2005 年1 月至2005 年6 月的数据进行分析。首先对原始数据进行预处理,采用遗传学习方法结合评估函数,可以得出最具代表性的属性集。其次对客户进行细分,采用改进的聚类算法实现,不需要输入初始聚类中心和聚类数目,该算法可以动态地得到聚类结果。
本文主要的工作集中在客户流失预测模型的建立,采用了一种基于遗传算法的数据分类方法对客户数据进行建模。首先在训练数据集上运用ID3 算法,产生若干分类规则集,由这些分类规则集作为初始种群,利用遗传算法的全局寻优能力,找到最佳分类规则集。将此分类规则应用到将要预测的数据集中,即可得到哪些客户有流失趋势。