论文部分内容阅读
在产品高度同质化的品牌营销阶段,各大电信企业的竞争更主要的是表现在对客户的争夺上,这就使得每个企业都存在客户流失的问题。客户流失预测模型常用来解决因为客户高流失率而导致的企业市场占有份额的减少、运营成本的增加和利润降低等问题;并且有针对性的对客户进行维护,从而保持企业的利润水平。因此,近年来客户流失问题成为了一个热门的研究领域,基于传统的统计学和数据挖掘对客户流失问题所进行的研究,虽取得了丰富的成果,但仍然值得进行深入的研究。本文采用广义线性混合模型研究客户流失预测问题,通过设定适当的随机效应,有效地将流失和正常状态的客户类别区分开,以达到企业找寻判定客户状态主要影响因素的目的,这也从一个新的角度加深了对该问题的理解。在这个预测模型框架构建下,利用广义线性混合模型来对昆明市电信客户数据进行实证分析。最后,采用模型评价指标对广义线性混合模型和其他常用建模算法的预测结果进行比较。主要结论如下:1.将广义线性混合模型引入客户流失预测分析领域,为客户流失问题的研究提供了新的路径。通过对电信客户消费数据的研究发现,它是一个典型的纵向数据,并且以往研究文献中所采用的传统客户流失预测问题的描绘方法与广义线性混合模型的结构具有很高的相似性。再加之广义线性混合模型不仅具有了广义线性模型处理非正态数据问题的能力,还能通过加入随机效应来分析不同样本之间的异质性和同类但不同样本之间的关联性,因此考虑采用广义线性混合模型对客户流失问题进行分析,以期能得到较好的预测结果。2.将地区因素作为随机效应构建客户流失预测模型是合理的。在新构建的分析框架的基础上,通过对昆明电信客户数据进行实证分析,得到影响客户流失的主要因素并构建了客户流失预测模型,发现将地区因素作为一个随机效应引入广义线性混合模型中进行分析能有效的提高模型的拟合效果和预测精度。这就为电信企业客户挽回措施提供理论依据的同时,也佐证了广义线性混合模型对于客户流失预测问题的适用性。3.采用错分代价为权数构建评价指标进行模型比较更科学。在客户流失问题的分析中,无论是选取的样本还是实际的总体,数据中正常和非正常状态的客户占比都是非平衡的,从而在模型评价的部分,采用传统的评价指标对模型进行比较,就容易产生评价结果的假象,给企业带来很大的损失。本文在分析的过程中,将模型产生错分行为对企业造成的损失不同作为权数,加入评价指标的构建中,从而使得评价指标更具有说服力。后通过计算比较发现,采用广义线性混合算法得到的预测模型,不论是回判的结果还是预测的精度都较之其它5种算法有所优化,从而进一步论证了广义线性混合模型的有效性、可靠性和实用性。