个人信用风险评估的一种基于XGBoost的集成学习方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:puppy_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信用卡数据建模的分类器构造问题中,“好”“坏”客户具有严重不均衡的数据特性,在抽样方法的框架下,解决数据非均衡性的方法主要是欠抽样、过抽样或者两者的结合,一般情况下,欠抽样会造成信息损失,过抽样易导致过拟合,本文基于XGBoost方法和集成学习的思想,提出一种拟袋装(quasi-bagging)方法,该方法简便易行,对多数类进行随机分组,用每组的多数类样本和一定比例或者全部的少数类样本建立子模型,最终结果由子模型预测均值或投票产生,该方法借鉴bagging方法中的集成思想,并利用训练集中所有样本信息进行分类器的构造,具有较高的模型准确率。每组子模型采用基于梯度Boosting的XGBoost方法进行实现,并进一步讨论了方法具有相合性等性质。实证分析的结果显示,本文的方法与若干已有方法相比,具有更好的分类结果。
其他文献
落实核心素养中的科学素养培育,对常州市花园中学而言,是一个值得研究的课题。学校制定了指向科学素养的“汇智工坊”项目计划(包括金艺坊、木艺坊、绿艺坊、科艺坊、陶艺坊)
目的本研究是在中医理论指导下,观察应用中药塌渍结合红外线照射这项中医护理技术对颈型颈椎病的治疗效果,分别比较在常规护理的基础上应用红外线照射、中药塌渍及中药塌渍结
目前,新一轮的教学改革正向纵深发展,教学的有效性问题引起教育界的日益重视。所谓“课堂有效教学”,就是最大限度的达到教学目的和教学效果。然而当下,不少历史老师存在这样
江苏省盐城肉联厂创建于1968年,是集生猪屠宰、肉制品加工、冷冻贮藏为主业的国有大型二档企业.在由计划经济向市场经济转轨过程中,由于受市场、体制和机制等因素的影响,冗员
近年来,随着我国综合国力的不断提升和对外开放的不断深入,加之全球化深入发展,世界各地都掀起了学习汉语的热潮。我国一系列对外战略的实施,国家大力推广汉语。在汉语国际教
本文从思想政治课课堂教学的常用教学环节角度,探究在各教学环节中如何渗透社会主义主义核心价值观教育。