论文部分内容阅读
发挥机器学习算法在分类预测方面的优势,通过实证研究探索付费知识直播用户流失预测模型,分析预测特征变量,为用户留存管理提供决策依据。以知乎Live为数据来源,从用户价值特征及评价特征两个维度出发,采集用户最近一次消费时间、月均消费次数、次均消费金额、首次消费时间及评分、评论文本共六项特征数据,基于六种机器学习算法构建预测模型,比较不同模型的预测效果。对比分析特征变量在用户流失预测中的贡献度,根据关键特征变量划分流失用户类型,提出相应留存策略。评分与评论文本情感对用户流失预测具有显著作用;基于集成学习的XGBoost用户流失预测模型综合表现最好,随机森林次之,集成学习优越的泛化性能得到验证;通过分析影响用户流失预测的重要变量,归纳总结出四类流失用户类型。