【摘 要】
:
近年来,随着消费观念的转变以及互联网金融的蓬勃发展,中国在线信贷业务日趋增多,个人信用贷款数据呈现爆发式累积,用户违约概率不断攀升,个人贷款的风险也渐渐显露出来。此时,就需要建立高精度的个人信用评分模型,对借款者进行真实可靠的信用评估,从而对危险的贷款申请做出预警。值得一提的是,在真实的金融信贷场景中,获得信用贷款的往往是信用评分较高的优质客户,其未来的还款行为可以被观测到,那些信用评分较差的被拒
论文部分内容阅读
近年来,随着消费观念的转变以及互联网金融的蓬勃发展,中国在线信贷业务日趋增多,个人信用贷款数据呈现爆发式累积,用户违约概率不断攀升,个人贷款的风险也渐渐显露出来。此时,就需要建立高精度的个人信用评分模型,对借款者进行真实可靠的信用评估,从而对危险的贷款申请做出预警。值得一提的是,在真实的金融信贷场景中,获得信用贷款的往往是信用评分较高的优质客户,其未来的还款行为可以被观测到,那些信用评分较差的被拒绝客户的未来还款情况却无从得知,使得在构建信用评分模型时常常抛弃拒绝样本只利用接受样本来建模。然而,放款机构面临的客群却是未来所有贷款者构成的总体,即入门总体,显然接受样本并不能代表入门总体样本。这种由于剔除了还款行为不能被观测到的被拒绝客户数据,所产生的训练样本选择性偏差会导致模型参数估计有偏,从而影响信用评分模型的精确度和信贷决策的有效性。由此,如何推断那些曾经被拒绝的贷款人的履约违约状况并贴上类别标签将其融入到建模样本中来,就是信用评分领域中一直难以解决的拒绝推断问题。
本文基于人工智能前沿技术,引入适应大数据集的集成学习算法(Bagging并行训练决策树得到的随机森林(RF)算法、Boosting串行训练决策树得到的梯度提升决策树(GBDT)算法、改进GDBT算法后得到的极端梯度提升树(XGBoost)算法以及Stacking异质集成学习框架)构建个人信用评分模型,并结合统计上的硬截止法来做拒绝推断。此外,针对硬截止法在临界概率值的选取上过于简单粗暴,且无法解决信贷数据集中样本类别分布不平衡问题的这两点缺陷,本文又提出了DBTS半监督学习技术来对硬截止法做出改进。因此,本文的研究内容主要是构建了一种非拒绝推断个人信用评分模型和两种拒绝推断个人信用评分模型(硬截止法下的拒绝推断个人信用评分模型和DBTS半监督学习下的拒绝推断个人信用评分模型),并在融360平台10万用户贷款数据集上进行了实证研究以及模型的双维度三视角多指标对比分析。结果证明,能否顺利的解决信贷领域中的拒绝推断问题,离不开有效的拒绝推断技术和优质的分类模型,本文提供的有效的拒绝推断技术是DBTS半监督学习框架,优质的分类器是Stacking异质集成学习算法。
其他文献
随着我国资本市场的飞速发展,居民储蓄率逐渐提高,证券投资基金逐渐发展成为我国居民理财工具的重要组成部分,大量的资金涌入基金行业,良好的运行机制是基金行业优化资源配置的重要保证。而现实中,基金经理跳槽率高居不下,基金管理公司也爆出频频丑闻,问题的背后是对基金经理监督的缺失,基金管理公司的治理结构不合理,整个基金行业激励机制的缺失,而基金行业的特殊的双重委托代理冲突是缺乏有效激励机制的根本原因。在这种
零工经济并不是一个新出现的名词,传统意义上的零工经济存在已久,本文提出的零工经济是伴随着移动互联网技术产生的,在当前“互联网+”的时代背景下,企业的组织管理向平台化的方向转变,越来越多的劳动者能够以更加灵活的就业方式获取工作报酬,零工经济不仅将资源的供给方和需求方高效匹配,还促进了传统产业的变革,推动了新兴产业的发展,创造了大量的就业机会,增加劳动者的收入。 在此次疫情期间,各类平台企业不仅以“
线性模型可以近似描述生物、医药、经济、管理、地质、气象、农业、工业、工程技术等领域的现象。它在现代统计学中得到了最为广泛的应用。在假定误差协方差阵为σ2In的情形下,通常使用最小二乘估计法来估计线性模型的回归参数。但是在许多情况下,线性模型的误差协方差阵具有形式σ2Σ,并且Σ往往包含未知参数。由Gauss–Markov定理可知,广义最小二乘估计是最佳线性无偏估计,并且广义最小二乘估计要优于最小二乘
我国要从制造大国转变为制造强国,迫切需要提升制造业技术创新能力。2018年近一半的外商直接投资(FDI)流向制造业,极大的促进了我国制造业技术创新。然而,外资企业通过设置高额专利转让费用、高薪吸引我国技术人才的方式抑制我国制造业技术创新,采取独资化手段抵消FDI带来的技术溢出效应。如何有效利用FDI促进我国制造业技术创新成为企业界和理论界思考的重要问题。 国内外学者主要从FDI对技术创新的总体效
自全球金融危机之后,世界多个发达经济体实施了宽松的货币政策以挽救经济,日本也在其列。在政策未取得良好的效果后,日本央行开始了负利率政策的大胆尝试,成为亚洲第一家推出负利率的中央银行。而中日经贸合作关系密切,日本国内货币政策的变动可能会给我国产出带来溢出效应。 作为最早提出量化宽松货币政策的国家,日本的货币政策在长期以来都受到国内外学者的关注。但各国学者多注重对日本货币政策的实施效果、国内的传导机
随着我国经济社会的发展和城市化进程的加快,以北京市为代表的我国大中型城市,普遍存在通勤高峰时段的城市道路拥堵现象。道路拥堵问题已经成为城市交通可持续发展亟待解决的问题。拥堵收费作为解决拥堵问题最直接、最有效的手段之一,难以实行和推广。多数大城市尚处于该项政策的观望、学习、研究阶段。究其原因,一方面,公众对拥堵收费的支持程度往往影响着政府的政策取向,拥堵收费容易遭到公众的反对而被搁置。另一方面,拥堵
北京市近年来积极进行产业疏解与人口疏解,有效降低了人口增速,缓解环境问题与资源紧张问题。同时北京市也在加大高精尖人才的引进力度,此举明显地促进了北京市产业结构的高端化与人才素质的高端化。但是,低技术的劳动密集型劳动力供给由于人口疏解政策的波及正在变少,而此类服务的生活需求却并未明显减少,所以其服务价格快速增加,增加了城市成本,也不利于高技术人才更有效率地发挥其应有的劳动生产率。 其实特大城市中的
随着2013年中国铁路实行政企分开的改革,如何认定铁路运输服务和项目的公益性以及如何使公益性变得更有效是深化中国铁路改革亟待解决的问题,但已有的学术和政策研究中,对于中国铁路公益性运输的定义、认定和补贴机制等多为较为抽象和模糊的定性研究,更缺少应用实际数据进行的落地性定量研究,影响了研究结果的科学性、可靠性和可操作性。因此,研究中国铁路公益性运输的认定机制以及补贴方式具有理论和现实意义。 本文基
近十年来中国经济高速增长,金融机构越来越多,信贷规模在投资驱动的新经济增长模式下迅速扩张,加上经济下行趋势和利率市场化因素二者的叠加影响,企业信用风险日益增加。中国银监会最近公布了2019年商业银行不良贷款率高达1.81%,是最近7年最高的不良贷款率,比2018年的高出0.14%。因此应当建立企业信用风险评估体系和评估模型,帮助银行降低信用风险,科学的指导银行对贷款的发放和预防,也可以促进中国经济
股票市场作为金融市场最重要、最复杂的组成部分,兼具着反映整体市场的变化趋势和反映国民经济总体发展水平的功能,同时为投资者投资决策提供重要的参考价值,是灵敏反映市场社会、政治、经济变化情况的晴雨表。然而,股票市场在多重因素的影响下,市场指数价格序列时常出现异常波动,使得传统的分析方法很难预测股价的走势。随着机器学习方法在分类和预测问题上凸显越来越大的优势,本文尝试将机器学习应用于股指预测问题上。