论文部分内容阅读
随着经济和计算机网络的飞速发展,日益激烈的竞争使得企业越来越强烈的认识到客户资源对于企业获胜起着至关重要的作用。因此企业开始从以产品为中心的模式向以客户为中心的模式转移,主要工作也围绕着保留现有客户和发展新客户展开,营销方式也从大众化营销转为通过差异化、一对一营销来实现客户满意和公司获利的双赢,而差异化、一对一营销的关键就是有效的客户细分。传统的客户细分主要根据客户的一维属性,通过一些统计学方法对客户进行简单的细分。但是,随着企业产品的进一步创新,客户需求日益多样化,传统客户细分在实践中的应用显得力不从心。应用数据挖掘技术进行多变量、大数据集的客户细分技术应运而生。使用数据挖掘聚类分析方法进行客户细分,不但可以处理几十、甚至上百个变量,从而对客户进行更精准的描述,客观反映客户分组内的特性并综合反映客户多方面的特征;而且还有利于营销人员更加深入细致地了解客户特征,便于实现对客户行为变化的动态跟踪;进而实现对客户提供差异化服务,提高客户的满意度和忠诚度,使企业创造更多价值。本文首先介绍了聚类算法进行客户细分的研究背景和意义,然后对数据挖掘技术中的聚类分析方法、客户细分以及聚类分析方法应用于客户细分的基本理论以及发展现状做了详细的概述,为后文聚类分析方法在客户细分中的应用奠定了理论基础。第二章详细介绍了客户细分的相关理论,包括客户细分的概念、意义以及一般方法和步骤;随后对传统客户细分与电子商务中的客户细分做了详细的比较,并对电子商务的客户细分的相关模型和技术进行了概述,为后续研究做好理论铺垫。第三章主要介绍了聚类分析算法的相关理论,包括聚类分析方法的概念和基本原理、聚类分析中常见的数据类型和数据结构以及常见的聚类分析方法类型,并对AP算法和k-means算法的相关原理、算法步骤以及优缺点做了详细的介绍,为下文改进k-means算法的提出建立了依据。第四章提出了本文的核心内容——基于半监督近邻传播的改进k-means算法(SAPK-means算法),从算法提出的意义、算法的具体流程、以及算法的验证实验三个方面进行了详细的阐述。验证实验表明,SAPK-means算法有效的排除数据集中的噪声数据和孤立点,得到了高质量的初始聚类中心,从而有效的提高了聚类精度;并对聚类的准确率以及簇间的紧密程度等都有一定程度的提升。SAPK-means算法与文中介绍的k-means算法、AP算法相比,可以取得更好的聚类效果。第五章将SAPK-means算法应用于某化妆品网站客户数据进行客户细分。详细论述了SAPK-means算法应用于客户细分中的步骤,对该算法的实现和性能分析进行了详细的描述,并对细分结果进行了详细的分析,对营销策略提出了可行性建议。在同一批数据样本中使用AP算法、k-means算法和SAPK-means算法进行客户细分,细分结果表明SAPK-means算法能够有效排除样本数据集中的噪声点,并在细分结果的质量上优于其他两种算法。最后对全文进行了总结,并指明了下一步的研究和工作方向,对改进k-means算法的进一步发展以及在客户细分方面的应用提出了自己的看法。