基于组合模型的互联网小额信贷违约识别

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:yuxume
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,互联网金融迅速发展,互联网借贷成为互联网金融发展最为迅速的模式,在互联网借贷规模快速扩大的同时,风险管理问题也日益突出。信用评分卡模型作为广泛应用的风控模型之一具有完善的理论基础和丰富的实践意义。但随着大数据时代的到来,用户的信息特征维度也逐渐变多,如何对海量的用户信息进行挖掘,充分发挥人工智能在用户违约预测上的作用,对于提高互联网借贷的风险管控能力,进一步促进互联网小额贷款公司健康发展有着重要意义,也是当今互联网背景下信贷业务需要解决的问题。本文以Lending Club的小额贷款业务数据作为研究对象,通过对比不同重采样方法和单一模型后,利用传统评分卡模型实现单一模型之间的组合,进一步优化模型的识别效果,探索更加有效的违约识别模型。本文包括五个部分内容:第一部分为导论部分,主要介绍了本文的研究背景及意义、国内外文献综述以及研究内容和思路。第二部分,对小额信贷的定义和特点、小额信贷风险的特殊性以及互联网小额信贷进行了介绍,接着对传统金融和互联网金融风险识别模型进行了对比阐述,最后对本文涉及的SMOTE重采样算法、Borderline SMOTE重采样算法、ADASYN重采样算法以及Logistic模型、Light GBM、NGBoost模型和组合模型原理展开了详细的介绍。第三部分在介绍了本文的数据来源和对数据进行描述性统计分析后,对数据进行了清洗,包括缺失值处理和分类变量处理。针对数据中的无用变量和分类变量处理后产生的冗余变量,首先计算IV值进行初步选择,然后运用随机森林根据特征重要性进一步筛选。第四部分首先选取了用于评价模型效果的指标,然后分别运用SMOTE、Borderline SMOTE、ADASYN重采样技术对数据进行不平衡处理,对于重采样前后共四个数据集分别运用Logistic、Light GBM、NGBoost三个单一模型对小额信贷违约风险进行识别,对比不同重采样技术的效果。然后将模型结果通过传统评分模型的计算方式,转化为信用评分,进一步实现模型之间的组合,提高模型的预测效果。第五部分对本文进行总结和展望,提出了文章进一步可优化的地方。基于上述研究结果,本文主要得到以下结论:(1)将IV值和随机森林结合可以有效剔除无用变量。(2)对比三种重采样算法,Borderline SMOTE重采样对于提升模型效果最有效。(3)利用评分卡模型实现模型组合可以明显提高模型的效果,相比于单一模型,组合模型的各评价指标都有不同幅度的提升,其中以Light GBM和NGBoost为初级学习器的效果最优。
其他文献
做空机制是一种创新型市场交易机制,在证券市场上发挥着重要作用。做空机制为市场提供的流动性能够改善股票的定价效率,达到抑制股票泡沫的功能。因此全球绝大部分证券交易所都允许做空机制的存在,中国A股市场也在2010年正式引入了融券制度。截止到2020年1月,A股可融券股票数量达到1600只,市场融资融券标的市值占总市值比重达到80%以上。然而,近年来做空机构频繁做空上市公司,尤其2020年新冠疫情以来,
学位
近年来,我国完成脱贫攻坚任务以后,相对贫困群体成为巩固拓展脱贫攻坚成果、防止返贫的重点关注对象。随着大数据分析等新型技术的推广应用,以及居民收入管理水平和投资理财意识的日益提高,数字金融扶贫效果也开始逐步凸显。相较于传统以收入为单一识别维度的指标体系而言,多维贫困识别综合考虑多个指标来进行判断,使得判断结果的准确度与可信度更高。精准识别多维贫困人群,并研究数字普惠金融服务如何进行多维扶贫,既能够为
学位
2021年12月10日中央经济工作会议上李克强总理总结指出,中国当前经济面临着人才需求紧缺、市场需求收缩、市场供给和预期逐渐下降的问题,并进一步强调了经济高质量发展的可持续化的重要程度。为保持经济基础的做大坐实,需引导和壮大金融机构对中小微企业和社会弱势群体等实体经济的支持,并通过金融业深化科技创新和绿色发展。要将“多边主义”理念应用到地区省份间的经济扶持,就必须重视数字普惠金融的发展。借助数字技
学位
随着人工智能等新技术的飞速发展,智能产品呈现爆发式赠长,家电场景智能化成为必然趋势。近年,新技术升级为扫地机器人市场带来了红利,扫地机器人产品的基础性能、智能程度得到了不断提升与优化。全球超90%的扫地机器人都制造于中国,中国也是扫地机器人全球销量最大的市场。行业内企业快速创新、保持竞争优势的同时,头部家电企业也争相布局、大力研发。同时,由于电商平台评论的特殊性,一句话中通常包含用户对于多种产品属
学位
企业是引领创新发展的第一动力,是推动高质量发展、建设现代化经济体系的战略支撑。然而,由于证监会对上市公司信息披露的强制要求,企业需要对外披露创新研发的相关信息,这可能使企业面临知识产权相关风险,所以大部分企业不愿披露相关信息。根据委托代理理论和不完全披露假说,企业可能会对信息披露模糊化处理,以减小风险。由于我国对信息披露制度的监管主要集中在数字信息披露,而没有重视文本信息披露,管理者可能加强了对文
学位
在线投资组合策略研究是量化策略研究中很重要的部分。在中国投资热情高涨,成交额破万亿时有发生,利用量化策略为投资者构建良好的投资组合,让人们能够分享到中国的财富增长,显然具有很强的现实意义。同时,从“风险”这一角度出发,给该领域的研究者提供更多维度的信息,为在线学习领域的学者提供一定的参考。在线投资组合领域经常被提到的是Cover(1996)等人提出的泛投资组合,而关于泛投资组合最知名的当属Helm
学位
随着社会分工的逐步深入和科技的不断发展,社会职位结构和工作岗位也会越来越精细化。针对该种状况,一方面,公司要求在最有限的成本下迅速寻找专业化的工作人员,另一方面,求职者们又期待能够迅速寻找并匹配到理想的工作岗位。因此人力资源供需双方都需要通过网络招聘平台提供更专业、细致的服务。但由于当前主要的网络招聘平台都是对多行业或者全行业覆盖,往往很难满足这类需求。为了解决此问题,本文通过实体关系抽取技术提取
学位
数字经济是大数据应用下的新经济形态,它透过利用信息的“识别—选择—过滤—存储—使用”这一功能途径,推动、促进信息资源的快速综合优化分配和经济效率高速发展。近年来,数字经济已经上升为国家战略,大数据、云计算、人工智能等新型数字信息技术也蓬勃发展。数字经济迅速兴起的今天,数字经济作为一个新型创新产业,涉及知识迁移、人才流动和社会经济关系等问题,往往存在着空间溢出属性,并呈现出空间聚集的特征。数字经济产
学位
随着互联网的发展,人们的信息获取需求已经不仅仅依赖于传统的工具如电视、报纸等,人们更关注信息的实时性,于是,网络视频在互联网浪潮中逐步发展起来,以哔哩哔哩视频网为首的视频平台在互联网的洪流中相互竞争,共同增长,另一方面,我国的网络视频用户规模也在不断增长,长短视频用户渗透率均不断增强,视频创作者也越来越多。本文以哔哩哔哩视频网站为例,采用网络爬虫方法爬取其视频数据,基于数据分析与挖掘的方法,对B站
学位
在国内国际双循环的新发展格局下,提升居民消费水平及质量成为我国扩大内需的重要切入点。然而,农村居民受到自身资本积累的限制,难以获取有效的金融服务支持,进而导致农村消费市场增长缓慢,各省市内部城乡消费水平依旧存在显著的差距。在数字经济持续发展的背景下,我国大力推动数字普惠金融服务建设,以期通过创新的金融产品和良好的金融市场环境缓解二元经济结构下的金融排斥现象。因此,如何通过发展数字普惠金融加速农村地
学位