【摘 要】
:
目前,机器学习模型在多方面取得了很好的成果,为各行各业提供了解决问题的有效办法。在金融领域,机器学习因其优异表现已经得到众多学者的关注,但是对于结构过于复杂的模型,却很难解释模型决策背后的逻辑,仅能得到模型预测结果,使得模型成为黑盒模型,严重阻碍了机器学习在金融领域的应用。基于此背景下,本文以金融领域中的银行业务为例,建立银行客户流失预警模型,旨在有效识别银行潜在流失客户,并通过模型可解释性分析,
论文部分内容阅读
目前,机器学习模型在多方面取得了很好的成果,为各行各业提供了解决问题的有效办法。在金融领域,机器学习因其优异表现已经得到众多学者的关注,但是对于结构过于复杂的模型,却很难解释模型决策背后的逻辑,仅能得到模型预测结果,使得模型成为黑盒模型,严重阻碍了机器学习在金融领域的应用。基于此背景下,本文以金融领域中的银行业务为例,建立银行客户流失预警模型,旨在有效识别银行潜在流失客户,并通过模型可解释性分析,挖掘出模型决策背后的有效信息,为防止客户流失提供数据参考与建议。首先根据原始数据特点进行数据清洗,主要包括缺失值处理以及重复样本处理。之后先通过特征粗筛去除只起到标记作用以及无统计意义的特征,再利用Lasso CV与皮尔逊相关系数法进行特征选择,进一步提升数据质量。同时银行数据还存在严重的不平衡性,使用BORDERLINE-SMOTE算法使得训练集平衡。接下来进行建模前的数据挖掘工作,包括可视化数据的分布情况、特征自身的规律、特征与研究目标的规律。在建模与模型解释方面分为两部分,第一部分首先建立了LR、随机森林、XGboost、light GBM,四种自身可解释的模型,对四种模型的结果利用ACC、F1_score、Precision、Recall四个指标进行对比,然后分析了四个模型对特征的重要性评价。但是这四种自身可解释模型在本文最关注的流失客户查全率(Recall)指标上只能达到60%左右,因此第二个部分建立了支持向量机与DNN两种黑盒模型,经过指标对比,DNN的效果最好,流失客户查全率(Recall)可达86%。之后利用三种与模型无关的的解释方法进行解释,首先利用Shapley值解释每个特征和实例是如何影响模型结果的;然后利用部分依赖图(PDP)解释几个重要特征对模型结果影响的边际效应;最后利用局部代理模型(Lime)对黑盒模型进行局部替代,从而解释模型是如何对单个样本进行决策的。本文在精准识别流失客户的基础上,从黑盒模型中挖掘出有用的信息,从而为银行业务人员进行客户挽留工作提供数据信息,及时挽留客户,提高银行的收益。
其他文献
拥有一定体量客户的企业在对应客户服务时往往面临着资源如何分配的问题。企业的资源是有限的,很难同时满足所有客户的需求。为使企业盈利达到最大化的同时保证客户较高满意度。企业需要对客户进行分类和识别,根据客户的特征与价值贡献,将客户进行细分不同群体后采取适当的服务策略。客户关系的改善是本文研究的重点。本文以制造业中零部件生产和销售一体的M公司为研究对象,分析其在客户分类和服务应对中存在的不合理的分类规则
智能体通过与环境交互,利用强化学习优化策略以实现回报最大化或完成特定任务。将强化学习与深度学习结合形成深度强化学习,它不仅具备强大的特征提取能力和表达能力以感知智能体属性信息和环境信息,而且具备强大的探索能力以适应环境的动态变化,在多个复杂问题中展现出良好的性能。尤其在多智能体协同决策任务中,多智能体深度强化学习已然成为研究热点,在无人机编队协同、交通枢纽控制和智能物流等多种领域被广泛应用。因此,
<正>文章从商业银行的视角出发,探讨了清算业务的发展演变,并梳理了商业银行清算涉及的组织、工具、系统三方面关键要素。然后结合银行清算实务,从信息流和资金流两个维度,对资金清算流程的各环节进行了系统阐述;最后结合清算业务发展趋势,从客户角度出发,探讨了未来商业银行清算业务的发展思路。
《民间借贷司法解释》第17条旨在解决欠缺借款合意部分的举证证明责任问题,正确理解和适用该条款,是解决相关民间借贷案件的基础和前提。但是对于该条款,不仅实务界存在适用上的困惑,理论学界始终也有认识上的分歧。本文试图透过具体案件剖析司法实践中适用的困境及理论争点,在审视第17条立法本意的基础上,探讨该条款适用的文义修正和逻辑完善问题。
随着社会生活的发展,机动车普及率显著提高,人们之间搭乘机动车的现象随之增多,好意同乘致损的情况愈来愈多。我国今年实行的《民法典》对好意同乘做了相关规定。这一规定是对我国依法治国要求的贯穿,也为法官审判此类案件提供了直接的法律依据,但是该规则在责任划分上仍存在一些不足,还有待进一步研究完善。《民法典》规定的好意同乘规则对同乘致损的责任划分不明确,仅规定无偿搭乘中供乘一方应当减轻责任承担,供乘人对受损
房地产行业一直处于高速发展阶段,近年来,国家先后对供给端房地产公司和需求端购房者出台一系列政策,这些政策一方面收紧房地产公司融资渠道,另一方面抑制了房价的上涨,增加了房地产行业的资金压力。房地产行业的经营模式比较独特,具有前期开发金额需求大,负债率高,运营周期长,不同地域差异大等特点。随着房地产项目的进行对资金链的良性运转要求越来越高,与此同时资金链隐患也大大增加,资金链是维护公司经营的基础,其畅
是枝裕和是“新日本电影新浪潮”的代表人物,也是当今日本电影最重要的导演之一。出身于日本社会经济腾飞时期的是枝裕和,在成年后经历了泡沫经济时代,巨大的社会变革对他的创作产生了重大的影响。他结合自身经历,将创作视角聚焦于普通日本民众的家庭生活中,他的14部电影长片作品中有9部与日本国内的家庭相关。本文将以这9部影片作为主要研究对象,深入探索是枝裕和家庭电影中代际关系的表达。本文第一章对选题的背景、国内
玉米(Zea mays L.)是最广泛栽培的作物之一,在确保中国的粮食安全和经济发展中发挥着重要作用。玉米对低温非常敏感,尤其是在幼苗期。因此,提高玉米的低温胁迫耐性可能对玉米具有重要意义。然而,玉米植物在转录组水平上对低温胁迫刺激的响应仍然存在疑问。在本研究中,玉米自交系B73幼苗在8℃下处理长达96 h。每隔4 h对幼叶取样一次,以获取冷胁迫刺激的动态变化。主要结果如下:1、通过对玉米苗期低温
目的:总结分析2019和2020年石河子城区宫颈癌筛查结果,并通过对比两年新疆石河子城区宫颈癌筛查结果,评估两年宫颈癌筛查实施情况,了解本地区妇女高危人乳头瘤病毒(High risk Human papilloma virus,hr HPV)感染及宫颈病变检出率的变化情况,为当地后续宫颈癌筛查策略改进提供理论依据。方法:1.回顾性收集2019年(18378例)和2020年(28616例)在新疆石河
近年来,随着人民生活水平的不断提高,人们对健康管理的需求与日俱增,再加上人口老龄化等因素叠加影响,使得我国医疗卫生事业的发展与群众的医疗服务需求矛盾日益突出。随着Web2.0技术的发展,“互联网+医疗”的模式被提出并广泛应用,缓解了医疗资源供需矛盾,也促使人们健康观念的转变,从过去被动的疾病诊疗转向更为主动的健康自我管理。其中,在线健康社区作为互联网医疗的重要组成部分,已成为人们实现自我健康管理的