【摘 要】
:
网络信贷产业覆盖了银行等传统金融机构未覆盖的中低收入人群,为中低收入人群贷款和投资提供了一个新的选择方案。然而,为了追逐利益而迅猛发展所遗留的监管措施不健全、信用评分系统不完善等隐患也在近几年迅速爆发,对该产业的发展造成了很大的影响。因此,构建有效的信用评分模型是解决当前网络信贷产业危机的关键。当前构建有效的信用评分模型主要面临两个问题。第一,信用数据的类不平衡问题。类不平衡会导致模型的预测结果偏
论文部分内容阅读
网络信贷产业覆盖了银行等传统金融机构未覆盖的中低收入人群,为中低收入人群贷款和投资提供了一个新的选择方案。然而,为了追逐利益而迅猛发展所遗留的监管措施不健全、信用评分系统不完善等隐患也在近几年迅速爆发,对该产业的发展造成了很大的影响。因此,构建有效的信用评分模型是解决当前网络信贷产业危机的关键。当前构建有效的信用评分模型主要面临两个问题。第一,信用数据的类不平衡问题。类不平衡会导致模型的预测结果偏向一类。然而,在以利益为导向的P2P网贷产业中,无论模型偏好哪一类都会给参与者造成经济损失。第二,面向多类型数据的模型在线更新困难问题。网贷平台拥有海量用户以及非常频繁的线上交易,伴随而来的是数据分布的快速变化,如果不及时更新模型,将导致模型的预测结果出现偏差。针对问题一,本文提出了一个重采样集成模型。该模型由基于多数类数据分布的欠采样方法和Bagging算法两部分组成。其中基于多数类数据分布的欠采样方法是在通过聚类获取多数类的数据分布后,再根据其分布对多数类进行欠采样。该欠采样方法能够在解决类不平衡问题的同时降低多数类信息损失。此外,该欠采样方法与Bagging算法结合不仅进一步降低了多数类的信息损失,而且还提升了模型的稳定性。本文在三个信用数据集上与多个基线模型进行性能比较。实验结果表明本文提出的模型取得了更高的AUC、G-mean值,具有更优的分类性能。针对问题二,本文提出了一个在线集成信用评分模型。该模型由两个神经网络组件线性组合而成,其中一个组件用于处理稀疏的类别特征,另一个组件则用于处理密集的数值型特征。后者通过对训练好的能够很好地处理密集的数值型特征的梯度提升树模型进行知识蒸馏来获得处理密集的数值型特征的能力。在将两个组件线性组合后,该模型不仅能够同时处理稀疏的类别型特征和密集的数值型特征,而且还能够在线更新。在两个具有时间戳的信用数据集上的实验结果表明,模型更新不及时造成模型性能下降的问题是确实存在的,而我们提出的模型在线上和线下实验中均取得了更高的AUC值,能更好地解决模型更新问题。
其他文献
中国作为一个负责任的大国,对于温室气体排放问题高度重视。近年来,随着国家“煤改气”策的推进和页岩气商业开采技术的进步,油气行业发展迅速,随之带来的温室气体排放增量也十分惊人。控制我国油气行业温室气体排放对于中国乃至世界应对气候变化事业意义重大。本文所讨论之油气企业系指从事石油天然气勘探、开采、储运、加工处理等油气生产活动的企业。前述生产活动涉及的温室气体排放行为包括燃料燃烧排放、火炬燃烧排放、工艺
每年爆发流感都严重威胁全球卫生安全,导致严重的经济损失以及人员伤亡。接种流感疫苗仍然是目前预防流感病毒感染最有效的手段。临床研究表明接种传统灭活流感病毒疫苗诱导神经氨酸酶特异性抗体反应较弱。然而,感染流感病毒诱导的神经氨酸酶抑制性抗体滴度水平与临床上免疫保护效力紧密相关。本课题组主要研究方向之一是基于甲型流感病毒神经氨酸酶研制广谱流感疫苗。为优化诱导神经氨酸酶广谱抗体的免疫程序,本课题尝试通过体内
电动自行车鼓式制动器的制动性能严重影响行车安全。2018年,《电动自行车安全技术规范》新国标的颁布,对制动器制动性能提出了更高要求。制动器在工作状态下,由于制动鼓与摩擦片非均匀摩擦接触,摩擦副产生局部热点和非均匀分布的温度场,导致制动鼓与摩擦片产生非均匀热膨胀变形,使得摩擦副的接触面积、接触应力和摩擦系数不断变化,导致制动抖动和摩擦片局部磨损过大。本文针对电动自行车80型鼓式制动器,分析摩擦副在不
近年来,环境恶化及能源紧缺问题随着汽车工业的迅猛发展接踵而至并日益突出。基于节约型社会的发展需求出发,无论对于传统燃油车或是当代大力研发生产的新能源电动汽车,实现汽车轻量化是节能减排,提升汽车综合性能以促进新时代汽车工业持续性发展的重要途径。而面对汽车轻量化工程领域中大量涌现的具有高维、高度非线性及大型设计空间的复杂黑箱设计优化问题,单纯采用基于代理模型的优化算法进行求解虽能有效减少有限元仿真模型
城市化发展使得城市间的竞争变得日益激烈,城市形象作为一座城市综合实力的外化显现,是城市核心竞争力的重要组成部分。移动互联网时代,短视频的发展为城市形象的建构与传播提供了新的机会。重庆和西安抓住这一契机,将抖音这个目前全网使用人数最多的短视频平台,作为城市形象展示的重要阵地,吸引上亿网友关注,其城市形象短视频的总播放量位居全国城市前两名,成为名副其实的“网红”城市。城市形象由城市实体形象、城市媒介形
随着物联网、人工智能、大数据以及云计算的快速发展,智能家居的产业布局在原有领域之上,逐步推动技术融合向纵深发展。早期智能家居产品多以家用安防、监控用途为多,近年来智能家居的发展主题,正在从以控制为中心、住宅为载体的多设备互联的集中化家居控制向以用户为中心、以内容和场景为载体的多元化体验过渡,逐渐贴近用户体验和生活的角度,关注用户从身体到精神的全面健康,致力于帮助用户形成科学、合理、智慧的生活方式。
红壤是我省重要的耕地资源,由于呈酸性,土壤肥力低下,限制了红壤区农业的发展。大豆是我省主要的粮食作物和经济作物,生产水平一直比较低下,主要通过增施氮肥提高大豆产量。根瘤菌-豆科作物共生固氮体系因其具有经济成本低,不消耗能源,绿色环保,为作物提供大量氮素的特点而走入人们的视野。为大豆接种高效优良的根瘤菌接种剂是减少氮肥使用,保护环境提高大豆产量的重要举措。然而,目前对我省大豆根瘤菌的多样性和生态适应
生命体征是反映人体健康状况的重要指标。通过对心率、呼吸率等生命体征的实时监测不仅可以反映人们的生理状况,还能对心血管疾病、睡眠呼吸暂停综合征等疾病进行诊疗和预防。因此,在日常生活中实现心率、呼吸率等生命体征的实时监测对人体健康监护和疾病防治有着十分重要的意义。目前,常见的生命体征监测设备操作复杂,且需要长期与受试者的皮肤接触,导致受试者感到不适与不便,无法满足日常监护的需求。随着计算机视觉技术的发
量子力学从诞生开始就充满了各种疑惑和争议,直至今天仍然未得到很好的解决。爱因斯坦学派(爱因斯坦、薛定谔、德布罗意等人)和哥本哈根学派(玻尔、海森堡、玻恩等人)之间长达三十年的论战,在表面上是关于量子力学理论问题的争论,但争论的背后却是深刻的形而上学和认识论问题。两派之间的争论在物理学上表现为相对论和量子力学理论之间的无法调和(量子引力理论至今仍未建立起来),在形而上学上表现为唯物论和唯心论之间的无
自动驾驶车辆横/纵向控制的主要功能是使车辆按照期望参考轨迹安全可靠地行驶,合理的车辆动力学模型和控制方法对车辆横/纵向控制至关重要。除此之外,精确的车辆状态与路面参数也是控制系统的关键输入。本文以智能网联车辆为研究对象,针对基于状态参数估计的自动驾驶车辆横/纵向动力学控制问题进行研究。主要内容如下:(1)基于自适应无迹卡尔曼滤波(AUKF)的多状态参数联合估计方法。采用一种派生的容错噪声统计特性估