大数据驱动的用户分析及行为预测研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zwj10191021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,在客户关系管理中,提前发现潜在流失客户并采取个性化激励措施已经成为企业持续健康发展的一个重要命题。一直以来,学术界和工业界都在积极探讨由数据挖掘技术支持的客户离网预测解决方案,并取得了令人瞩目的研究成果,然而,在流失预测、欺诈识别、疾病检测、事故监控等领域,数据失衡的情况时有发生,绝大多数机器学习算法都不能从不平衡数据中正确学习,相关工作主要集中于提高分类模型的精确度方面,忽略了细分受众群的作用。即便考虑了客户细分的影响,也只利用客户交易数据来进行定量分析,对客户分群问题的解释度不够,对后续客户离网预测的意义不大。因此,本论文展开了客户细分和流失预测两个方面的研究,同时还引入了纵贯其中的两大保障体系:“数据挖掘技术”以及“科学评估指标”,采用理论结合实践的方式,主要完成了如下工作:(1)研究了数据处理技术、客户细分方法和流失预测方法分析了数据的规范管理、数据的可靠集成、数据的有效清洗、“距离”的弹性度量方法、数据的合理变换、数据的灵活拆分、数据不平衡问题的无偏性处理、特征的条件提取、特征的正确选择和算法导论。(2)解决了银行客户细分问题将自适应权重的双级聚类算法推进应用、深化和验证。首先,结合哑编码、正则化等数据预处理手段,运用PCA对属性变量进行维数约简的聚类归并,自动调整特征投影系数,可以解决现有研究可能存在的信息受损、多重共线性、数据冗余等问题,然后采用K-Means++算法对客户类别进行高度抽象的聚类细分,并引入有效性评价指标Inertia和Silhouette确定具有突出影响的最佳聚类参数,对聚类结果加以检验,模型表现较好,解决了长期以来客户分群碎片化、信息过载等复杂问题。(3)设计了一种基于客户细分的银行客户离网预测解决方案首先,提出了一种异源集成算法G_R_L_D,应用于不平衡数据构建的客户流失预测模型,精确率达79%,优于绝大多数常见机器学习算法,有助于对抗数据失衡。然后,采用SMOTE-ENN采样,有效处理了银行客户流失数据的全局不平衡特性,提高召回率的同时保持了高精度,并进一步将G_R_L_D模型及其基准分类器的准确率提高了 3%以上。最后,提出了单边SMOTE-ENN纠偏采样,有效处理了银行客户流失数据的局部不平衡特性,并针对不同客户群进行个性化建模,查准率优化了1%,其他性能指标总体表现平稳、稳中有进。
其他文献
落实全民健身国家战略是推动健康中国建设体育强国的基本工作任务,为优化政府服务职能转变,大力推动全民健身公共服务发展,让基层群众享受到体育事业发展成果,增强获得感和幸
在我国广大企业中,家族企业占有重要比例,是支撑国民经济发展的重要组成部分,特别是进入新世纪,民营经济中相当一部分是家族企业,而随着经济发展的开放性和“大众创业,万众创
科学技术的迅猛发展,促进了二十一世纪计算机技术的快速提升。在数字媒体技术的辅助之下,计算机动画拥有了更强的技术表现力和更丰富的艺术创造力。受新兴数字媒体技术和影视表现手法的影响,动画创作者开始给观影者们带来更为丰富、细腻的视觉艺术呈现,使动画短片艺术发展到了一个新的高度。计算机技术的更新,既丰富了动画的制作技术的种类,又为创作者们节省了时间,因而推动着动画艺术创作研究的广泛和深入。一部优秀的动画作
青少年科普读物在促进青少年个人成长,提高民众科学素养,促进社会发展方面发挥着重要作用。鉴于我国提高学生科学素质和共享人类科学成果的必然需求,译介国外优秀青少年科普读物的需求长期存在,其引进数量大,社会影响大。然而青少年科普读物理论研究却长期处于匮乏状态。究其原因,首先是其所属的科普翻译这一大类受到翻译界的关注不够,科普读物翻译理论未成体系,再是青少年科普读物作为科普翻译读物中专门面向青少年受众的分
东峡煤矿矿区因开采煤层造成的地面塌陷十分严重,而塌陷导致的地表水平变形、垂直变形也很严重,地裂缝、塌陷槽等不计其数。有少数村民居住于矿区之上并从事农业活动,采煤塌陷产生的地表高差容易发生滑坡等次生灾害,威胁到村民的生命财产安全。矿区地表覆盖的第四系沉积物以黄土为主。本文将东峡煤矿采煤塌陷区作为研究区,使用从研究区采回的土样,对原状土和重塑土设计了控制含水率和干密度的三轴剪切试验,并对原状土做扫描电
糠醛,作为一种最重要的生物质平台化合物,可以通过分子氢催化加氢和“非外加H_2”的催化转移加氢的加氢工艺,实现糠醛转化为糠醇等重要化工产品。本文制备了Ni-P@C、Fe_3O_4@C、CoO@C和Fe_3O_4/C催化剂,采用外加分子氢或以醇类为氢供体,实现糠醛催化加氢反应,主要研究结果如下:(1)采用水热法制备基于金属有机框架(MOFs)的Ni-P@C催化剂,共沉淀法制备非负载的Ni-P催化剂。
以往城市规划管理重点关注城乡规划的编制、实施以及监督,但随着城市不断扩张,城市新区建设经常会遇到城乡规划与各类规划之间产生矛盾,导致城市发展受阻。党的十八大以来,“多规合一”概念的提出以及实施落地,使得政府需要重新审视城市规划管理的内容,研究新的城市规划管理的相关方法。本文以黑龙江省省会哈尔滨市的城市规划管理体系作为研究对象,综合运用文献研究法和比较分析法搜集与城市规划管理相关的理论成果中本文研究
在新一代高推重比涡扇发动机设计中,复合材料轴结构的失效模式分析研究是低压涡轮轴结构完整性的重要组成部分。本文针对复合材料轴结构失效模式问题,开展了复合材料轴结构力学性能分析、横向拉伸载荷下应力集中系数的计算分析与含界面的复合材料失效计算三个方面的工作:基于复合材料宏观力学理论,构建复合材料轴结构宏观力学分析模型,计算不同载荷与铺层方案下的轴结构宏观力学性能。分析表明不同温度载荷下,铺层角度为45°
曙光稀油油藏于1975年投入开发,并于1976年开始注水,经过几年的快速上产,1980年该区域年产油量迅速上升至130×104t,并且随着后续不断新增动用储量,从1981年至1990年,曙光稀油油藏在1%的年采油速度上保持了10年之久,但是,伴随着开发时间的逐渐延长,地层压力低、注采井网欠完善、油藏动用不均等问题日益严重,于1991年起,该区域年产油量以平均每年4.5×104t的递减幅度快速下降,
知识经济时代,创新对社会经济发展的影响愈发显著。创新也在深刻地改变着区域内城市之间的相互关系,城市创新联系领域的相关研究不断得到丰富和拓展。目前学者针对城市间的创新联系的研究大致有创新在城市的扩散及空间格局演变研究、城市创新网络的结构特征研究以及城市创新联系的相关分析与影响因素研究研究等方面。在研究方法上主要应用的是定性的理论研究及定量的计量分析研究。其中使用引力模型等空间相互作用模型、构建指标体