基于机器学习的个人信用风险评估模型研究——以A公司小额短期信贷为例

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:oihvhuhuiuiui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从2008年开始,小贷公司经历了从试点到快速成长,从竞争激烈再到快速减少的阶段。2020年6月末相对2019年年末减少了200多家,并且多家出现亏损现象,小额信贷公司要想长期经营下去,普惠金融要想持续发展,风险控制变得尤为重要。近几年的政府工作报告和行业峰会也不断地提及要加强普惠金融的监管和风险控制,2020年7月的普惠金融圆桌论坛中,专家们也一致认为要鼓励数字技术赋能普惠金融,完善征信体系,加强信息风控。在当今金融科技开始遍布国内外,业务信息量大,办理速度快的大环境下,必须依靠技术手段进行风险的管理,以大数据、互联网、云计算、人工智能为核心的新型金融科技为信贷的创新发展赋能,从而减少信息不对称,更精准的评价客户的风险。国内外的学者在信贷风控的研究上做出了很多的贡献,从简单的线性模型到复杂的非线性模型,再到机器学习。信贷行业在国内发展的比较迅速,但是在信用风险评估的研究方面,国内相对国外起步比较晚,并且以往的研究中涉及的数据量相对比较小。纵观历来学者的研究,针对单一模型的研究比较多,组合模型的研究比较单一。本文基于多个分类模型和组合模型,以某小额信贷公司真实的数据为样本,对借款人的信贷风险进行了研究。首先针对独立的分类模型进行了理论的介绍,对其算法和使用场景进行了简要的介绍,接着对于模型的评估方法进行了分析。之后介绍了样本集预处理的方法和步骤,为后续的建模做铺垫。本文随机采样了某信贷公司近两年中真实发生过借贷行为的三万多条数据作为样本集,进行研究和分析,分别用逻辑回归、支持向量机、随机森林、XGBoost四种算法进行风控建模,训练,预测,模型评估和优缺点的分析,四个独立的模型也各有优缺点,逻辑回归模型有更高的稳定性,支持向量机模型更适合推荐算法,在二分类问题上表现比较差,随机随林模型表现出了最高的精确率,XGBoost整体表现出了比较平衡的精确度和召回率,对好坏客户有较好的区分能力。最后还对四种模型进行了融合建模,目的是把不同模型的优势集中起来,提升精确率、敏感性和稳定性,本文把支持向量机、随机森林、XGBoost三种模型分别给予一定的权重进行训练,得到一级模型,再用逻辑回归作为二级模型作为训练,最终得到了一个四种算法结合起来的组合模型,进行初步的训练,得到了更高的精确率和对好坏客户的区分度。不同的模型有不同的适用场景,反欺诈模型需要更敏感的模型,也就是较高的召回率,建议优先选择逻辑回归和XGBoost模型;信用评估业务要求跟高的精确度和稳定性,建议优先选择融合模型和随机森林模型。本实证分析还进一步研究对比了样本的均衡程度对模型表现的影响。为了解决样本不均衡验证的问题,本研究采用无监督的SMOTE算法,此算法更不易产生过拟合的问题。结果表明,支持向量机模型对于数据的不均衡很敏感,召回率波动会比较大,而XGBoost模型和随机森林模型对数据是否均衡相对不太敏感,在样本正负比例均衡时,模型表现的变动不明显。所以在实际问题中,信贷评估模型的选用,不仅要考虑业务场景的需求,而且要考虑已有数据集正负样本比例的问题。本文选取了用户在不同手机软件的行为轨迹数据,作为部分特征变量,比较新颖,随着移动电子设备在人们生活中越来越重要,相信这类特征变量的分析是风控建模未来的趋势。本研究不仅搭建了单独的算法模型,而且尝试采用对多个独立的模型用并行和串行相结合方式进行融合,得到了更具适合风险评估场景的模型,这是对融合模型的一次大胆尝试,也给后续的研究提供了新的思路。本文对于信用评估模型的研究,在风控模型的特征变量的选择和模型的选型上,对信贷公司进一步开展业务都有一定的借鉴意义,进而为其降低放贷成本,获得更多的利润提供可能性。同时为金融机构的授信提供更多的实践经验和建议。最后对于征信体系的建设,在保障信息安全的前提下,本文提出了从科技手段和规则制度上解决数据孤岛,实现流通的建议,最终达到推动普惠金融持续健康地发展,助力国家普惠金融战略的落地的目的。
其他文献
伴随我国改革开放,经济腾飞,大众与日俱增的法律服务需求促进法律服务行业迅速发展。自1979年国家恢复并重建律师制度的40多年来,律师事务所的组织形式从国资所一统天下发展为以合伙制律师事务所为主,个人所、中外合资所、外资所并存的“百家争鸣”的局面,律师的工作内容与定位从“国家的法律工作者”转变为“为当事人提供法律服务”,法律服务行业的变化,对律师提出了更高的执业要求。客户希望获得全面综合的法律服务的
学位
随着我国居民财富的增长,人们对投资工具的需求越来越多元化,由于公募基金具有投资门槛低、流动性强等特点,基金已经成为居民理财的主要工具之一。债券型基金作为我国公募基金市场上的重要组成部分,因其收益较高、风险相对可控等优点,受到广大投资者的青睐。但随着近年来宏观经济发展进入新常态,我国信用债市场违约风险案件频发,信用债违约数量、违约规模均呈现爆发式增长。如何在获取高收益的前提下有效规避债券市场“灰犀牛
学位
改革开放至今,我国经济发展突飞猛进,其中金融形式的多样化发展趋势显著。普惠金融的发展对缓解贫困、缩小贫富差距、促进产业结构调整、增加居民收入和促进经济发展都起到了的非常重要的作用。普惠金融的出现正是符合“兼顾公平”的必然结果,它有效打破金融门槛,为低收入人群、贫困人口和小微规模企业等社会弱势群体增加了以可承担的对价体面地享受金融服务的可能性。而就业,作为民生问题的重中之重,关乎着每个生活在经济社会
学位
随着我国经济社会的不断发展,家用汽车市场迅速膨胀,成为我国经济的新增长点。在这一背景下,汽车金融业务产生了大量需求。对商业银行而言,汽车金融业务具有显著优势,不仅可以与相关中间业务结合,具有广阔的发展前景,同时受经济周期性影响较小,风险水平较低,属于银行等金融机构的优质业务。在经济进入新常态背景下,各大商业银行面临着日益严峻的金融市场竞争,因此大力推进汽车金融业务,对实现自身业务结构转型,提高对金
学位
城市商业银行零售业务营销工作的开展过程中,营销渠道所发挥的作用是非常巨大的。当前,我国正处于社会和经济飞速发展的阶段,而且金融一体化发展趋势也越来越明显,在先进科学技术的推动之下,城市商业银行零售业务拓展过程中营销渠道同样不断创新和发展,营销渠道日益丰富。目前,电话银行、手机银行以及微信银行等营销渠道自身拥有更加便捷与灵活的特性,更加符合现阶段零售业务渠道服务多样化以及个性化的实际需求,银行机构对
学位
近年来,由于世界经济一体化进程逐步推进,全球经济格局也发生了巨大的变化,在这种情况下很多企业为了提升竞争力开始对自己的营销理念以及营销方式进行创新。但在日益加剧的市场竞争中,营销手段趋于同质化,使单个企业依靠仅有营销资源实现营销成功变得越来越难。此时,共生营销成为企业关注的焦点。共生营销使得早期营销理论中的对抗性竞争理念发生转变,其核心思想是竞争并非市场中唯一可以获得最优利润的方式,合作能够使竞争
学位
自从上世纪80年代融资租赁传入我国,该业务模式已经在国内发展了30多年。这几年,国家对于融资租赁业务进行了大力扶持,融资租赁公司在数量和质量上都有极大的增长,最终使得融资租赁能够更好地服务于实体经济。截止2019年12月底,我国融资租赁公司总数突破了1万家,已经达到了12130家,全国融资租赁资产总额达到6.65万亿元。在我国经济发展速度不断下降的今天,融资租赁行业的逆势快速发展,有力扶持我国实体
学位
中国汽车,自2009年到2019年,产销量冠居全球,2019年产量为2572万辆,销量为2577万辆,虽然同比都下降了几乎达到8.3%,但是无论是产量还是销量都保持全球第一,这一点可以从中国汽车工业协会统计的数据得到证实。同时2019年新能源汽车产量为124.2万辆,销量为120.6万辆。由于汽车的排放标准越来越趋紧,使得新能源汽车受到了人们的青睐,推动了新能源汽车的发展,于此同时也间接带动了汽车
学位
2019年8月17日,中国人民银行发布2019年第15号公告,决定改革完善LPR形成机制,并推动LPR进一步发挥贷款市场“基准利率”的作用。LPR是由包括国有四大行、股份制商业银行、城商行、农商行、外资银行以及互联网银行在内的18家国内银行共同报价而形成的“贷款基础利率”。其“MLF+报价行平均加点”的形成机制,将贷款利率的传导机制由“基准利率-投放利率”变为“政策利率-贷款基础利率-投放利率”,
学位
近年来,中国高速发展的社会经济和已经被广泛应用的互联网技术让当今中国的教育产业模式在不断的更新迭代。2020年疫情的突然爆发,为响应国家“停课不停学”的政策号召,各大教育机构加速转型,通过推出各类型的在线课程来提升市场占有率并加速在线教育市场的下沉,由此,“互联网+教育”开始改变青少儿教育市场。一方面,教育市场的交易成本不断降低,极大程度的实现教育资源共享;另一方面,随着接受教育的用户数量的不断增
学位