【摘 要】
:
P2P借贷的虚拟性和信息的不对称性使其面临着比传统金融模式更严峻的违约风险,有效的风险管控是P2P平台稳健发展的基本保障。然而,P2P借贷数据的广泛性和多样性使其面临着更严重的缺失问题。如何利用P2P平台的不完全数据,完成有效的违约风险建模是本文需要解决的问题。本文将P2P借贷中常见数据缺失问题细分为数据属性值的缺失和类别标签的缺失,并探索如何利用缺失数据提高模型的违约风险预测性能。针对数据属性值
论文部分内容阅读
P2P借贷的虚拟性和信息的不对称性使其面临着比传统金融模式更严峻的违约风险,有效的风险管控是P2P平台稳健发展的基本保障。然而,P2P借贷数据的广泛性和多样性使其面临着更严重的缺失问题。如何利用P2P平台的不完全数据,完成有效的违约风险建模是本文需要解决的问题。本文将P2P借贷中常见数据缺失问题细分为数据属性值的缺失和类别标签的缺失,并探索如何利用缺失数据提高模型的违约风险预测性能。针对数据属性值缺失的问题,传统分类算法需要首先基于数据随机缺失的假设填补缺失数据,然后训练模型。然而缺失数据通常是三种缺失类型混合的,单一的缺失假设会影响数据填补结果,从而影响模型效果。本文使用对缺失数据鲁棒性较强的树模型来建模,并提出基于LightGBM分类算法构建违约风险评价模型,不仅不需要对缺失数据进行预填补,而且具有较高的效率。最后,基于人人贷平台的数据进行实证分析,验证了直接基于LightGBM建模优于传统填补方法后模型效果。针对类别标签缺失的问题,传统违约风险评价仅使用有标签样本建模。然而模型的应用对象是全样本,由此带来的样本选择偏差问题会影响模型泛化能力,需要对无标签样本进行拒绝推断来校正样本选择偏差。本文使用半监督方法构建违约风险模型,并提出基于样本和特征双重差异的协同训练模型TRICMV。该模型采用了基于“多视图学习”的模型投票机制和基于“噪音学习理论”的自适应的模型迭代机制,可以控制加入模型中的噪音。最后,实证分析结果验证了TRICMV模型的有效性。
其他文献
目的和意义有限元方法作为一种常用的力学分析方法,最早于1972年开始应用于骨科领域。由于其可在不同状态下模拟被测对象活动,得到不受实验条件影响的结果,能任意改变其中任
在市场经济条件下,减轻企业税负是提高企业竞争力的一个重要手段,企业如何合理合法地筹划纳税方案,使其税负最低,效益最高,这是目前企业税收筹划中的关键问题。本文从税收筹
本研究以杜鹃花科杜鹃花属比利时杜鹃(Rhododendron hybridum Hort.)为研究材料,进行了生殖生物学及组织快繁两个方面的研究。利用传统的石蜡制片技术,对比利时杜鹃花芽分化、
本文以近代吴淞城区变迁为研究对象。吴淞原名胡巷桥,是宝山县的一个小渔村。它跨越蕰藻浜,地处长江与黄浦江的交汇处的吴淞口,是进入上海的“咽喉”,被誉为军事重镇。自上海
提高水性聚氨酯的综合性能是聚氨酯结构改性的重要研究内容。论文从三方面对水性聚氨酯进行改性即主链结构改性,环氧树脂接枝共聚改性和蒙脱土纳米材料的复合改性。主链结构改
目的研究HIFU治疗腹、盆腔良恶性肿瘤近期疗效和安全性,了解晚期胰腺癌病人疼痛的疗效和外周血免疫功能的变化。方法2002年10月~2005年2月符合研究条件的良恶性肿瘤100例,应用
在乳胶基质生产线上,引入压力测试技术的破乳监测系统,可在第一时间处理乳胶基质破乳产生的废料,确保乳胶基质的合格率。破乳监测系统基于流体力学中的液阻效应,当乳胶基质粘
<正>在讨论班主任这个话题的时候,需要考虑小学班主任和中学班主任的差异。小学班主任最好是慈母形象,小学班主任的关键要素是"爱心"。中学班主任最好是严父形象,中学班主任
山西省以推行住宅商品化为中心内容,通过出售公房、提租补贴、建立公积金、集资合作建房等多方面的探索,使全省住房改革与建设取得了很大进展和成效。但当前房改也还存在一些主
<正>作为中国传统文化重要组成部分的本土宗教——道教,在两千多年的历史过程之中,积淀形成了数量众多的珍贵道教文化遗产。其中较为世人所重的主要是道教的经典文献,而对传