基于带多数类权重的少数类过采样技术和随机森林的信用评估方法 - 开源共享论文下载平台 - 信丰网

基于带多数类权重的少数类过采样技术和随机森林的信用评估方法

来源 :计算机应用 | 被引量 : 13次 | 上传用户：lzt870702

【摘要】

：

针对信用评估中最为常见的不均衡数据集问题以及单个分类器在不平衡数据上分类效果有限的问题,提出了一种基于带多数类权重的少数类过采样技术和随机森林(MWMOTE-RF)结合的信用评估方法。首先,在数据预处理过程中利用MWMOTE技术增加少数类别样本的样本数;然后,在预处理后的较平衡的新数据集上利用监督式机器学习算法中的随机森林算法对数据进行分类预测。使用受测者工作特征曲线下面积(AUC)作为分类评价指

【作者】

：

田臣周丽娟

【机构】

：

首都师范大学信息工程学院

【出处】

：

计算机应用

【发表日期】

：

2019年06期

【关键词】

：

不平衡数据集机器学习带多数类权重的少数类过采样技术随机森林信用评估 umbalanced datasetmachine learningMajority

【基金项目】

：

国家重点研发计划项目(2017YFB1400803),国家自然科学基金资助项目(31571563,61601310)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对信用评估中最为常见的不均衡数据集问题以及单个分类器在不平衡数据上分类效果有限的问题,提出了一种基于带多数类权重的少数类过采样技术和随机森林(MWMOTE-RF)结合的信用评估方法。首先,在数据预处理过程中利用MWMOTE技术增加少数类别样本的样本数;然后,在预处理后的较平衡的新数据集上利用监督式机器学习算法中的随机森林算法对数据进行分类预测。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在UCI机器学习数据库中的德国信用卡数据集和某公司的汽车违约贷款数据集上的仿真实验表明,在相同数据集

其他文献

腰椎峡部裂的CT征象及其临床意义

目的分析腰椎峡部裂的CT征象及其临床意义.方法对45例腰椎峡部裂的CT表现与临床症状的关系进行了回顾性分析.结果45例腰椎峡部裂中,发生在L3见于2例,L4见于15例,以及L 5见于2

期刊

腰椎峡部裂CTLumbar vertebra Spondyloschisis Tomography X-ray computed

辩证分析建设项目招投标剖面图

对目前建设项目招投标的现状进行了全面的分析，结合哲学的辩证思维方法论述了我国现行招投标制度的利与弊，并针对存在的问题提出了相应的改革措施。

期刊

建设项目招投标辩证法construction project bidding dialectic

负载均衡技术的分析与应用

介绍了常见的负载均衡技术方案，就负载均衡方案中均衡调度、健康状态、持久等策略进行了研究，并结合实际工作中负载均衡的应用实例做了相关描述。

期刊

Alteon负载均衡集群高可用Alteon load balance cluster high availability

肺炎性假瘤的HRCT诊断

目的探讨肺炎性假瘤的CT表现.方法21例经手术或病理证实的肺内直径小于2.0 cm炎性假瘤患者均经胸部高分辨力CT(RHCT)检查.其中,15例又经增强CT扫描.结果HRCT证实,21例病人中,

期刊

肺炎性假瘤高分辨力CTLung Inflammatory pseudotumor HRCT

小导管注浆技术在南水北调工程中的应用

从小导管注浆工艺流程、小导管制作、注浆材料及注浆设备、封闭掌子面、注浆施工等方面介绍了小导管顶注浆的施工技术，并对特殊地段的注浆技术措施进行了详细阐述，为今后类似工

期刊

小导管注浆技术南水北调注浆材料注浆设备ductile grouting technology south-north water transfer

2cm以下周围型小肺癌的CT诊断（附32例分析）

目的进一步提高对周围型小肺癌(SPLC)及早期肺癌的CT诊断水平.方法收集经手术或穿刺病理证实直径小于等于2 cm SPLC 29例,经临床证实3例.全部病例先行常规扫描,病灶区再行薄

期刊

肺癌体层摄影X线计算机增强扫描Lung cancer Tomography X - ray computed Enhanced scanning

烟用香精中烷基吡嗪类化合物的合成与应用

介绍了的牢来吡嗪类单体香料在烟草增香中的应用研究进展与现状和该类化合物的合成与精制技术，增香方法。

期刊

烟用香料吡嗪氨基─羰基反应

其他学术论文