基于集成学习方法的互联网消费金融个人信用评估研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:qutong19921107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在“互联网+”的大背景下,传统金融机构与互联网深度融合,互联网消费金融应运而生,形成了以银行、电商平台、消费金融公司等为主体的多元化运作模式,并且以其无担保、无抵押、放款快等特点迅速渗透到现实生活中的各个消费场景中,加速了个人消费信贷市场的发展,改变了个人消费理念和消费习惯,在促进消费,拉动经济增长方面发挥了重要的作用。但是由于互联网消费金融行业普遍存在的个人征信短板、信用数据缺失、过度授信等问题,在其快速发展的背后,也隐藏着许多风险,其中信用风险又最为关键。因此,针对互联网消费金融面临的信用风险问题,本文分别从改进个人信用评估方法和完善个人征信体系两方面着手,基于互联网消费金融公司内部真实数据,利用个人的传统信用信息以及新的互联网信息(即从互联网上提取的用户通讯行为信息和同盾贷前审核信息,为了便于表述,本文统称为互联网信息),建立适用于互联网消费金融行业的个人信用评估模型以及相应的信用评估指标体系,旨在进一步增强其信用风险防范能力,发挥助力普惠金融、促进经济健康发展的积极作用。
  为了更好地实现上述研究目标,本文首先通过梳理国内外学者在互联网消费金融、个人征信体系以及个人信用评估相关领域的研究成果,揭示出本文的研究背景、意义及框架。其次,本文分别对互联网消费金融相关概念、个人信用评估方法以及集成学习方法的原理进行了较为详细的介绍,为后文的实证分析提供理论依据。再次,本文利用国内某互联网消费金融公司内部真实数据,从提升集成模型整体性能出发,引入贝叶斯优化算法对各个基模型进行参数优化,构建了基于贝叶斯优化(Bayesian Optimization:BO)的Stacking集成分类模型(BO-Stacking),并通过实证对比分析验证了该模型具有较其他评估模型更优的分类性能。最后,本文对互联网信息的有效性进行分析,并利用XGBoost模型特征重要性分析的功能以及Kolmogorov-Smirnov(KS)检验方法,筛选出重要性排名靠前的特征,用以构建基于互联网信息的个人信用评估指标体系。
  本文研究主要有以下三处创新:
  (1)数据来源及特征构造上的创新。本文数据来自国内某互联网消费金融公司经用户授权使用的内部真实数据,有真实的应用场景,除了包含传统的信用评估特征之外,还包含从用户通讯报告以及同盾贷前审核报告中加工提取出的很多新的特征,涉及用户大量线上数据信息,并且这些数据较难伪造,能够真实反映用户的行为特征,因此本文数据在特征构造方面不同于传统的信用评估,在此基础上建立的评估模型,具有较强的实用性和可靠性,更加适合于互联网消费金融场景。
  (2)信用评估模型上的创新。本文选取了Stacking方法来实现异态集成,从提升集成的整体性能出发,基于集成理论中“好而不同”的思想,本文使用不同的集成算法来构建基模型,并引入搜索效率更高的贝叶斯优化算法对基模型进行参数优化,以使其达到更优的性能,同时采用K折交叉验证法防止过拟合以及增强基模型之间的差异性,最终建立本文的BO-Stacking集成分类模型,并通过实证对比分析验证了该模型在分类性能上的优势,有助于加速个人信用评估方法的创新。
  (3)信用评估指标体系上的创新。本文针对数据集中新的特征构建了基于互联网信息的个人信用评估指标体系。具体来说,本文首先对互联网信息的有效性进行了分析,证明了这些信息能够提升模型性能,可以用于个人信用评估领域。其次,本文利用XGBoost对特征的重要性进行估计,筛选出重要性排名靠前的特征,并通过KS检验方法进一步验证这些特征在识别违约风险上的作用。最后,通过相关性分析,得到了这些特征指标的具体取值和违约风险大小的关系,并以各个特征指标的重要性分数计算相应的权重,构建出基于互联网信息的个人信用评估指标体系,能够为现有的个人征信指标体系提供一定的参考和有益的补充。
其他文献
学位
学位
创新是企业增加其核心竞争力、保持市场地位和增厚利润的源泉。在企业发展过程中,控股股东的行为和决策很大程度上决定了企业的创新方向和投入,那么研究控股股东相关行为对企业创新投入的影响成为学者近来研究的热点问题。近年来,股权质押成为上市公司控股股东的重要融资工具。根据wind数据库显示,截止2019年年底,中国上市公司股权质押总市值为45816.8亿元,占A股总市值的7.06%。股权质押在以其盘活资产、
学位
2020年是中国脱贫攻坚的关键之年,在这一年中国将实现全面建成小康社会这一伟大的奋斗目标。人民群众是国家之根,国家的兴衰与人民群众的幸福密切相关,贫困问题的存在会在很大的程度上制约一国的发展。消除贫困,从而实现共同富裕,是实现社会主义的本质要求。中国在现阶段的扶贫工作已经取得了举世瞩目的成就,农村的贫困人口已经在大幅度减少,贫困地区的基础设施建设在现阶段也得到了明显的改善,社会事业都在不断地进步。
近年来,股价崩盘逐渐成为热门话题,2007和2015年两次股市暴跌给市场带来了巨大的冲击。与西方发达国家成熟资本市场相比,中国资本市场起步晚,各项机制不够成熟,所以股价崩盘风险更高。面对这样的环境,研究外部监督机制是否能有效地降低股价崩盘风险就显得格外重要。  本文从理论出发分析了企业生命周期阶段特点,股价崩盘风险的影响因素以及各监督机制对股价崩盘的作用。由于股价崩盘风险的影响因素较多,并且企业在
学位
自Ritter(1991)首次系统提出新股长期弱势这一问题以来,IPO后公司股价的长期表现受到国内外学者广泛关注,国外学者认为新股长期弱势的表现普遍存在于新兴、成熟的资本市场,而中国学者在不同时期对中国A股市场是否存在新股长期弱势这一现象的研究中得出了不同的结论。  此外,在中国A股市场中,投资者对新股狂热的追捧,引起了“IPO抑价”现象,但超低的中签率又使绝大多数投资者难以获取可观的“IPO抑价
学位
中国证券市场发展至今已有20多年的历史,虽然发展速度很快,但是相比于国外发达国家的资本市场来说还不够完善,市场投资者经常是非理性的,容易受情绪的影响。市场的不完善导致了市场信息的不对称性,投资者在这种情况下会过分寻求能够影响市场的消息以扩大自身收益,并且自身知识能力的局限性也会对获得的信息产生有偏的理解。除此之外,法律规章的不完善也使得投资者的情绪容易在市场中扩散蔓延,从而引发金融市场价格的波动。
学位
机构投资者是资本市场的主要参与者,截至2018年末,境内外机构投资者持股比例占中国资本市场流通A股的比例已达到80.38%,机构持股改变了公司的股权结构,在资本市场中发挥着重要的作用,机构投资者持股对被投资企业价值的影响引起了学者的广泛关注。一部分学者认为机构投资者持有上市公司股票的目的仅仅是为了利用短期的交易性投资进行套利,其没有动机参与上市公司的治理;另一部分学者认为随着资本市场制度的完善和机
学位
波动率作为金融资产的一项重要属性,常用来衡量资产的风险水平,在金融衍生品定价、风险管理、投资组合构建等领域起着重要作用,因此不难理解波动率估计和预测为何成为金融研究的热点方向之一。进入二十一世纪以来,计算机存取技术和数据处理能力大大增强,高频交易数据获取难度减弱,又由于高频数据包含有更多的信息,基于高频数据的波动率估计及建模预测成为学术界和实务界关注的焦点。作为最早提出的一种已实现测度,已实现波动
学位
中国股市频繁暴涨暴跌,千股跌停、千股涨停的现象并不罕见。这不仅扰乱资本市场运作秩序,造成投资者心理恐慌,也降低资源配置效率,阻碍资本市场改革步伐。关于股价崩盘风险的研究已深入到公司的多个方面,目前的研究主要集中在公司内外部特征层面,涌现出大量文献对公司管理者进行分析,包括高管性别、名人独董、CEO任期、CEO权力、CFO文化背景等。本文从高管晋升激励的视角切入,研究薪酬差距对股价崩盘的影响,并探究
学位