【摘 要】
:
针对电信客户流失模型的构建,提出了基于不均衡数据处理与组合模型相结合的集成方法。按固定比例同时对数据集中多数类样本和少数类样本抽样,形成一个新的子数据集,重复该过
【机 构】
:
中国电信股份有限公司云南分公司,云南财经大学统计与数学学院,云南财经大学信息学院,云南省高校数据化运营管理工程研究中心
论文部分内容阅读
针对电信客户流失模型的构建,提出了基于不均衡数据处理与组合模型相结合的集成方法。按固定比例同时对数据集中多数类样本和少数类样本抽样,形成一个新的子数据集,重复该过程并训练多个基分类器;将基分类器进行线性组合,利用Lagrange函数求解组合模型的系数。利用某企业宽带客户行为数据训练模型,进行隔月预测。实验结果表明:该方法相对于各单模型,在F1值和对少数类的预测命中率上分别提升了2.3%和2.1%,可以帮助企业制定挽留方案。
其他文献
背景与目的:有研究表明野生型p53可以诱导RGS16表达,而RGS16可能与胶质瘤的发生有关。本研究旨在探讨RGS16基因转染对大鼠胶质瘤C6细胞生长的影响。方法:构建真核表达载体pIR
动漫产业具有融汇古今文化、民族文化、世界文化的产业优势。我们应制定相关的文化策略,将文化深植于动漫产业及产品中,提升动漫产业的文化张力,使动漫产业内在结构有张力,外
设计开发了一套单兵体温实时采集与监控系统,模拟前线单兵体温等信息发生变化时,后方指挥所通过电台获取传感信息,实时掌握单兵身体情况,并在必要时组织救援,以此达到提升战