基于客户细分和XGBoost算法的携程客户流失预测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:LUZIBIN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
客户是推动企业长远发展的燃料,随着消费市场的竞争加剧,各企业在客户保留上变得愈发困难,尤其对许多服务型企业来说,获取新客户往往要比维护老客户多付出数倍的精力和成本。因此,客户流失是任何企业都需要重点监控的一个问题。但目前为止,客户流失预测模型普遍集中于传统机器学习算法(如逻辑回归、决策树等),对于XGBoost(eXtreme Gradient Boosting)等一些近年来逐渐流行起来的算法的应用还比较缺乏。除此之外,客户流失预测作为客户关系管理的重要研究课题,应加强与其它相关理论的结合,进一步提升模型的预测性能。
  针对上述问题,通过对携程客户流失数据集进行分析建模,完成了如下几项工作:首先,对原始数据集进行预处理,包括缺失值填充、数据标准化以及数据类别平衡等;其次,以客户价值理论为依据,对RFM模型进行改进和扩展,得到历史总订单数、最近一次订单距今时间、消费能力指数以及价格敏感指数四个聚类特征,然后使用K-means算法进行客户细分,并在每类客户群体上构建基于XGBoost算法的客户流失预测模型;最后,以逻辑回归、决策树和深度神经网络为基准算法对XGBoost算法进行评估,并且设置两组对比实验来验证客户细分对模型性能的提升效果,然后基于客户细分结果进行客户定位并给出针对性的流失管理建议。研究结果表明,与其它三种算法相比,XGBoost算法在各项评价指标上表现出了显著的优势。而且,基于客户细分的XGBoost模型在准确率、召回率和AUC值上较客户细分前分别提升了2.75%、0.80%和3.00%。
其他文献
新时期以来,我国日益强调农业经济管理的现代化、职业化、创新化,以期加快新型职业农民的培育以及农业经济管理优化策略的应用进程。由王培志主编的《农业经济管理》一书是系统论述现代农业经济管理理论与实践体系的学术专著,对促进我国农业经济管理人才的专业化培养,加快新时期我国农业经济管理策略的专业性优化进程,有一定的参考价值。  该书在内容上共包括十一章:第一章导论,整体上阐述了农业在国民经济中的地位和作用,
期刊
近年来,我国电子商务行业蓬勃发展,网络购物已经成为现代商业活动的重要组成部分。随着网购用户规模和网络零售额的快速增长,各大电子商务网站的商品数量已经呈爆炸式增长,网购用户遇到比较严重的“信息过载”问题,在制定购买决策时往往存在很大的不确定性。一方面,在线用户在网络购物过程中存在“信息迷失”现象,往往缺乏足够的知识和时间去做出合理的决策;另一方面,在电子商务平台上,网购用户可以很容易观察到其他人的选择。众多电子商务平台都通过提供商品排行榜和在线评论信息等为在线消费者的购买决策提供支持。在这种情况下,在线用户
电力负荷预测在电网管理中发挥着越来越重要的作用。尤其随着海量居民用户级负荷序列得以采集存储,精确的负荷预测将有助于进一步优化机组调度计划,降低启停成本。目前,较多研究将用户聚类分析作为区域负荷预测的预处理步骤以提高负荷预测精度。但其主要聚焦于单值负荷预测,而未考虑区间负荷预测和概率负荷预测。区间负荷预测和概率负荷预测可提供更为全面的预测值分布,对调度决策具有重要意义和价值。本文将基于聚类分析的区域单值负荷预测框架扩展至区间负荷预测和概率负荷预测,探究不同聚类方法、聚类相似性度量方式以及聚类个数对区间负荷预
互联网技术的发展促进了社会化媒体的飞速发展,为信息的有效传播和积累增长带来空前的助力,因此信息的质量问题受到了大量关注和讨论。作为一种典型的社会化媒体形式,社会化问答(Social Question and Answering, SQ&A)平台上积累了用户发布的海量信息,其中用户生成问题(User-generated Question, UGQ)是用户在平台中发起的问题条目信息,其质量问题不容忽视。现有研究在回答内容的质量方面做出了大量讨论,而对UGQ质量的研究却甚少。UGQ质量的有效度量对平台规范管理、
随着制造技术和信息技术的进步,愈加白热化的全球竞争和时尚趋势,以及消费者对产品的独特性需求日益增加,越来越多的企业开始探索消费者参与的产品定制。但是消费者参与大规模定制面临两个决策问题:一是企业在满足消费者溢价偏好和生产成本效率之间的权衡;第二,消费者在根据自己的需求定制产品和交互成本之间进行权衡。
  本研究的第一部分是消费者参与企业大规模定制战略的影响研究,将消费者融入制造商的定制过程,并将企业与顾客的互动程度定义为大规模定制的水平,建立Hotelling模型结合了企业和消费者在交互过程中所面临
当今如此众多的电视品牌,想要在激烈的市场环境中站稳脚跟,就离不开销量预测。目前,大部分企业对于产品的销售预测是依靠决策人员对产品的认识以及前期的经验,具有一定的盲目性和随意性,无法合理的安排生产和采购物料。本文拟采用循环神经网络及注意力机制对某企业的电视品类销量数据进行合理预测。
  循环神经网络作为时序数据预测中较为主要的手段,在很多数据预测领域已经有了一定的应用。本文选取某企业电视品类的销量数据进行预处理,剔除离群点数据并进行归一化处理,构建循环神经网络中的RNN、LSTM、BLSTM三种模型,
新闻信息和股票交易信息是投资者判断股票变化趋势的主要来源。新闻信息相对于股票交易信息难以描述,相关研究也比较少。近年来兴起的机器学习、深度学习等技术,特别是自然语言处理技术为进行高效的文本分析提供了可能。本文通过模拟投资者综合利用新闻信息和股票交易信息来判断股票趋势的学习过程来对股票变动趋势做出智能高效的预测。
  本文首先仅考虑新闻文本信息影响力多样性因素,借鉴自然语言处理技术中的注意力机制技术,建立了层次注意力网络模型(HAN)。之后,再加入新闻文本内容相关性因素,引入自注意力机制技术,建立了带
2019年,全国电子商务交易额达到了惊人的34.81万亿元,电子商务快速发展的大环境背后隐藏的的是物流订单数量的高速激增。物流企业一旦到达物流高峰期,爆仓现象比比皆是。此外,RFID、EPC和GPS定位等各种物联网技术已经趋于成熟,并且大量投入生产使用,新兴的物联网技术已经在结构上改变了传统物流系统的控制体系。物流不再是一个个孤立的节点,而是形成了物流网络,网络中的各个节点前后互相联系又互相制约。每个物流节点都潜伏着爆仓也就是突变的风险,而突变的因素又恰好隐藏在物流节点的运行数据中,本文通过对这些数据进行
随着移动互联网越的发展,传统中小型餐厅接入餐饮B2B平台,以实现采购的全流程的在线管理。其中,餐饮B2B平台将配送服务外包给货运平台,餐饮B2B平台需要选择合适的配送策略以降低配送成本,提升其竞争力。同时,在线平台具备处理即时信息的能力,可实现当日送达,进一步丰富了配送策略。因此,如何选择合适的配送策略及是否应该实现当日送达服务成为了餐饮B2B平台值得关注的问题。
  本文以最小化餐饮B2B平台的配送成本为目标,对不同配送策略下的配送问题进行了研究。在餐饮B2B行业下,主要有三种可行的配送策略会被考
本文主要研究的是风险厌恶型零售商的订货决策问题。在生产经营中,零售商往往趋向于规避风险,追求损失风险最小化。在此设定下,当需求分布已知时,已有大量相关研究;然而,当市场需求分布函数未知,并且订货环节中的相关成本与市场需求分布情况相关时,难以沿用传统思路,先对观测数据拟合需求分布,再确定最优订货策略,这就为实践带来了较大挑战。为解决上述问题,本文引入“数据驱动”的思想和“边学习-边优化”的理念,将数据引入模型代替传统假设,并将学习和优化两个相互独立的阶段进行有效融合,设计了用以求解需求分布函数未知情况下风险