基于混合采样和集成学习的小微企业信用风险评估研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:zhangwang198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着国家“一带一路”倡议的逐步实施,特别是在“大众创业,万众创新”的号召下,我国小微企业发展迅速,目前我国小微企业数量占企业总数比例已超过90%。小微企业作为我国国民经济的重要组成部分,对增加就业、活跃市场、改善民生、促进经济结构优化等都有着不可替代的作用。但在金融市场中,小微企业融资“冰山”却难以消融,小微企业获得的金融支持远远不及其对我国经济的贡献。究其根本,是因为小微企业大多缺乏健全的财务制度且负债结构复杂,在需要融资时往往因为信用难以准确评估而受到限制。因此,建立精准的小微企业信用评估模型,以实现对小微企业失信风险的有效识别,对于金融机构和小微企业自身都具有极其重要的意义。本文从与小微企业信用密切相关的政府各部门记录的企业多方面行为足迹数据出发,结合双重集成思想,构建了Borderline SMOTE+Easy Ensemble混合采样+XGBoost模型。本文首先对获得的数据集进行了大量的预处理工作,包括数据清洗、特征构建、特征转换等,保证了数据能被有效地用于建模。此后,考虑到数据存在的极度不平衡问题,将数据处理方法与集成学习算法结合,使用Borderline SMOTE+Easy Ensemble的混合采样方法生成多个平衡训练子集,为了提高分类准确率,选用XGBoost算法并通过样本扰动、输入特征扰动、参数扰动的策略,训练产生多个多样性的子分类器,最终以Bagging策略构建集成分类模型,实现对未知样本的有效预测。为了证明本文设计的Borderline SMOTE+Easy Ensemble混合采样+XGBoost模型的科学性和有效性,本文选择Recall、G-mean和AUC作为评价准则,对比传统不平衡数据处理方法在本文数据集上的效果,以及决策树C5.0、随机森林算法作为基分类算法在混合采样集成框架上的效果,结果验证了本文设计的模型具有更优越的性能。因此,本文的研究可以帮助金融机构有效预测和识别具有失信风险的小微企业,一方面可以提高金融机构的风险防范和管理能力;另一方面通过疏通小微企业的主要融资渠道,也有利于优化小微企业的融资大环境,缓解小微企业融资难问题。
其他文献
影子银行十几年以来处于高速发展状态,我国的影子银行主要行使类似传统商业银行信贷中介的功能,与欧美国家发达的影子银行市场不同,我国影子银行业务金融创新程度较低,前期主要通过商业银行非保本理财类业务募集资金,通过与信托、证券等非银金融机构合作将资金投向市场,而后则主要以买入返售、同业理财等同业业务为载体,影子银行的一系列变化也深刻影响着我国社会融资体系和信贷规模。货币政策是调节宏观经济运行的重要工具,
我国社会主义市场经济的长期稳定增长,始终离不开国有企业的有力支撑,为了保证国民经济更高效有序地发展,国有企业和国有资本在经济新常态的背景下,又将被赋予新的使命。然而目前国有企业内部股权结构单一、缺乏市场竞争力等问题在国有企业内部仍较为突出,相对于其他非国有企业,在内部经营效率、资本配置效率、降低政治依赖性等方面仍存在着一定的提升空间。所以,想要激发企业活力、提高管理效率,让国有企业在市场经济中发挥
审美教育对培养学生的审美兴趣、审美品味和健全人格具有重要意义。小学第一学段正是对学生实施审美教育的启蒙时期。这一时期的审美启蒙,对他们形成高尚的道德情操、促进他们的健康成长,至关重要。小学语文教学应该启发小学生发现美、感知美、内化美、创造美,实现美育。由此,本文基于部编本小学第一学段的语文教材,探讨开展审美启蒙教育的问题。研究内容包括以下几个部分:绪论部分,介绍在小学第一学段开展审美启蒙的选题背景
阅读是日常生活中最常见的一种现象,从古至今人类文明的传承与发展都离不开它。现在是社会文明高度发达的社会,人类的生存与进步更不能离开它。《小学语文新课程标准》要求学生能够独立自主的阅读,掌握多种阅读的方法和技巧,通过广泛的阅读获得丰富的知识文化积累,与此同时培养语感,注重情感体验,提高对文本的感受能力和理解能力,能够自主的读书看报和欣赏文学作品,课外阅读量达到100万字以上。《小学语文新课程标准》还
随着我国经济迅猛发展,城镇化进程加快,乡村景观逐渐失去了乡土特色,所体现的地域性民族文化也在慢慢缺失。在大力提倡乡村振兴和新农村建设的背景下,着重保护地域特色,发扬传承民族文化显得尤为重要。由于乡村景观其独特性,包含地理条件的不同和民族文化的差异,所以其表现出来的文化属性具有一定特质,对此特质的传承和保护是进行乡村景观提升和整治的前提。相对于国外,我国关于乡村景观的研究比较晚,基于国家提出“三农”
阅读在英语教学中一直都占据着非常重要的地位。深度阅读作为一种有效的阅读方式,强调学生不仅要掌握基础语言知识和基本技能,还要进一步提升思维品质,促进学生核心素养的发展。但在目前的小学英语阅读教学中,由于缺乏有效的课堂互动而阻碍学生深度阅读能力发展的现象还是很常见的,具体的问题主要有:阅读教学模式化,忽视学生的主体地位;阅读教学碎片化,忽视学生和文本的有效互动;阅读任务浅层化,忽视学生阅读素养的培养;
1952年,Markowitz首次提出了资产组合均方差理论,这标志着现代资产组合理论的一个开始。此后的数十年期间,资产定价模型不断发展。具有代表性的有 William Sharpe(1964)等人提出的 CAPM 模型,Ross(1976)推导出的 APT模型以及Eugene Fama和Kenneth French(1992)实证得出的三因子模型。此后,为增强传统资产定价模型对股票收益率的解释力,
《国家中长期教育改革和发展规划纲要(2010-2020年)》重点强调了当今我国的教育现状以及如何对中小学生展开培养,更好地锻炼其社会实践能力,帮助学生发展自身德育素质,激发学生创新能力。河北省2019年发布《中小学综合实践活动课程指导纲要实施办法》,强调社会实践活动课在中小学课程设置中的重要地位,并指出社会实践活动课需要升级为学科课程。研学旅行作为中小学社会实践教育的重要方式之一,已经受到各学校愈
资质过剩感知指的是员工认为他所拥有的知识、技能、经验等超过了实际工作所需要的。随着现在组织中资质过剩感知现象的日益明显,如何充分利用员工的冗余价值为组织赋能对组织发展具有重要意义。以往学者较多关注其对角色内行为所产生负面影响,如:时间侵占行为、工作脱离、反生产行为等,对利于组织有效运作和发展的组织公民行为关注甚少。本文通过对相关研究的整理分析,运用实证研究的方法对资质过剩感知和组织公民行为之间的关
“全面二孩”政策的实施必然导致人口数量和规模的增加以及社会结构的变化,同时家庭结构变化也会引发父母育儿观念与方式变革。育儿胜任感作为父母在养育孩子过程中对自身养育能力和行为的一种信念,其育儿胜任感水平体现了父母的养育能力,同时影响到孩子的良好性格形成和健康发展。本文以家庭系统理论和社会支持系统理论为基础,以重庆市Y区二孩家庭父母为研究对象,主要采用问卷法,采用《父母育儿胜任感量表》对二孩家庭父母的