【摘 要】
:
随着互联网金融行业的不断发展,网络借贷作为一种新型融资方式已逐渐走进人们的视野。但是近年来随着网贷平台数量的增加,平台质量良莠不齐,贷款违约现象频发,给网贷行业造成了极大的负面影响,因此如何规避信用违约风险是目前亟待解决的问题。现如今,网贷平台的数据大都存在特征维数高、正负样本不平衡等问题,这为信用风险建模带来了一定的挑战。为解决上述问题,本文从特征选择、数据不平衡处理以及分类算法这三个方面进行研
论文部分内容阅读
随着互联网金融行业的不断发展,网络借贷作为一种新型融资方式已逐渐走进人们的视野。但是近年来随着网贷平台数量的增加,平台质量良莠不齐,贷款违约现象频发,给网贷行业造成了极大的负面影响,因此如何规避信用违约风险是目前亟待解决的问题。现如今,网贷平台的数据大都存在特征维数高、正负样本不平衡等问题,这为信用风险建模带来了一定的挑战。为解决上述问题,本文从特征选择、数据不平衡处理以及分类算法这三个方面进行研究,从而建立信用风险预测模型,来评估借贷人的信用违约风险。首先,在特征选择阶段,提出混合Filter和随机森林的特征筛选方法。该方法先利用改进的Relief算法对特征进行初步筛选,通过增加对少数类样本和边界样本的关注来降低数据不平衡带来的影响。之后再结合最大信息系数法剔除冗余特征。而为了得到最佳的特征子集,又进一步结合随机森林算法筛选特征,并得到最终的结果。其次,针对数据比例失衡影响模型分类结果的问题,提出改进的过采样方法。该方法在Borderline-SMOTE方法的基础上,引入自适应密度思想和改进的插值方法,为每个边界少数类样本合成数目适宜的新样本,并且使新样本的插值区域更靠近原少数类样本,以避免样本边界模糊的现象发生。最后,为了进一步提高模型的分类效果,提出一种基于集成学习的信用风险预测模型。该模型先修改Light GBM算法的损失函数为Focal loss,并以改进后的算法作为基分类器,再结合随机子空间方法和Ada Boost算法对基分类器进行集成,从而建立信用风险预测模型。基于Lending Club网贷平台的借贷人数据进行实证研究,并通过与其他集成分类模型的比较分析,证实了本文提出的过采样方法和集成分类模型的有效性,以及更适用于不平衡数据集下的信用风险评估问题。
其他文献
基于传统机器学习分类算法对影像组学的高维不平衡数据分类结果不理想的问题,本文提出一种改进海洋捕食者的不平衡特征选择算法。首先,对海洋捕食者算法MPA算法进行改进,引入精英反向矩阵增加算法迭代后期的种群多样性,引入新的CF参数改善算法的收敛速度与精度,同时合理分配原始参数分布和取值来满足算法在不同阶段的搜索需求;接着针对不平衡数据引入新的目标函数来帮助MPA算法收敛到更优的特征子集。最后,基于G-m
为解决模糊数据的插值问题,利用两点三次Hermite插值公式与三转角方程对样条基函数进行构造,根据不同的边界条件获得插值点的一阶导数信息,再结合模糊数对插值点进行模糊化处理,基于不同的光滑度要求,给出2种模糊样条函数的表达式。最后通过数值算例,验证了构造方法的有效性。
介绍了一种应用于高速动车组充电机的VIENNA整流器,全部采用碳化硅(SiC)功率器件。与传统的硅(Si)不控整流器相比,基于SiC的VIENNA整流器,交流侧谐波含量低、功率因数高;与脉宽调制(PWM)整流器相比,功率开关数量少、桥臂无直通危险。SiC器件相比Si器件,导通电阻小、工作频率高、损耗低。首先简要介绍了VIENNA整流器的基本原理,然后,针对17 kW系统的三相输入电感、直流输出电容
目的 :观察易筋经功法在治疗老年2型糖尿病患者中的疗效。方法 :收集2020年10月—2021年8月上海市杨浦区殷行社区卫生服务中心门诊老年糖尿病患者120例,随机分成对照组和观察组,每组各60例。对照组采用常规药物治疗;观察组在常规药物治疗基础上坚持易筋经功法锻炼,1周3次。疗程3个月。观察两组血糖控制情况、血脂水平。结果 :在血糖控制方面,观察组干预后的空腹血糖(fasting blood g
课堂教学评价是教育评价的重要组成部分,课堂教学观察是教学评价的基础.基于课程标准的教学建议,本文剖析了课堂教学观察的"三个维度四个方面",强调课堂教学观察要重点关注数学学科核心素养的达成情况,深化和突出教材的教学资源情况,以及信息技术与数学课程的融合情况.然后结合一个具体案例,给出了课堂教学观察与评价.
群文阅读教学是新教材的内在要求,是一种适合当今文化环境的阅读教学方式。群文阅读教学如何开展?在教学中要注意些什么?笔者认为一是设计中的“推类组元”,二是课堂实践中的“归类向深”。
初中英语阅读在考核系统中所占的比例递增,新课标也对初中生的阅读能力提出了越来越高的要求。可见,在初中英语教学中,英语阅读扮演着极其重要的角色。然而,我国的教育仍存在大部分以应试为基础的教育模式。学生仅形成单词层面理解文章的逻辑思维,忽略对于整篇文章的理解与文化语境的感知。长期固化思维导致学生难以形成实用的英语阅读思维模式。因此,教师要想提升教学质量,则需要改革与创新教学模式。在教学中,思维导图通过
本文结合视频会议系统实际运维保障过程中所遇到的典型问题,归纳故障处理原则与程序,分别对视频会议系统典型的视频、音频等故障分析与排查情况进行了深入探讨,为提升视讯运维保障能力能够起到一定的支撑作用。