小样本低质量数据下贷款需求分类模型研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:Gloria_SHU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着国民经济的快速发展,以及国家相关政策的鼓励扶持,中小型企业大量出现.随之而来的问题是小额度贷款的需求量增大.与传统的银行借贷模式相比,小额度贷款更具灵活性.因此,如何快速、准确的判断一个企业是否有贷款需求至关重要.本文主要针对中小型企业的贷款问题,在完整展现企业数据分析流程的基础上,讨论了在小样本低质量数据的情况下,如何有效地进行数据分析、建模.本文在数据缺失特征较多、数据来源较差、数据量较少的情况下,详细讨论了如何进行数据预处理、探索性数据分析和模型建立.在数据预处理过程中,采用了“严内宽外”以及“全部宽松”两种策略相结合的方式对数据进行贷款需求标注;在探索性数据研究过程中,采用了不同贷款需求下单变量分析的方法;在模型建立的过程中,采用了条件投票选择的模型聚合方法.最后我们得到了一个稳定性相对较高的贷款需求模型,且最终模型的预测准确率达到了76%.在建模过程中,采用逻辑回归模型作为基本模型,减小了过拟合风险;在数据分析流程中,充分考虑了建模目的以及之后的模型更新.因此,通过在整个数据流程上的特别处理及分析,最终模型较好的拟合了小样本低质量数据下中小型企业的贷款需求.我们根据最终模型对新的数据推荐出一批企业,得到了良好的反馈结果.
其他文献
金融危机给人类的发展带来了严重的冲击,随着经济全球化趋势不断加强,这种冲击进一步扩大和增强。近十几年来,各国家和地区均爆发过多次的危机,但综合来看尤以1997年亚洲金融危机
自1998年人民银行县支行发行库撤销,带来一系列的问题,如县域内人民币的及时供应问题、小面额人民币券别的调配、人行自身职能作用的发挥等,恢复县人民银行人民币发行库建设
住房公积金制度的建立本质上是一种产权的重新界定和安排。这一新的产权安排产生的利益结构调整效应和资源配置效应导致了一系列的公平性问题。本文以相对均等的公平观为基础
利用电教媒体,可以激发学生参与物理实验活动的兴趣。通过电教手段的模拟,将实际问题转化为物理模型,可以弥补实验不足,增强实验演示效果。利用计算机虚拟现实技术可以展现微
目的 分析接诊流程的重组优化在ICu中的应用。方法对Icu护理工作中存在的问题进行调查,依据调查结果重组优化Icu护理接诊流程,然后对重组优化前后患者的接诊时间、患者及家属对
高校图书馆各个应用系统中存储着大量结构化与非结构化数据,对如何解决文献资源存储的压力与日俱增。云计算和云存储的出现,无疑为图书馆文献资源的存储提供了一种崭新的、较为
全球金融和经济趋向一体化发展的大浪潮中,很多新兴经济体遭受金融危机的无情打击和困扰,其产生的负面效应对发展中国家构成巨大挑战。银行作为金融机构的重要组成部分,金融
三角函数的性质是近几年高考的重点,熟练掌握及应用函数性质是高考考查的内容,所以用三角函数性质求最值也是学生必须掌握的内容.
阅读教学就是学生与文本之间的对话,通过语文阅读教学让学生在阅读中获得语文知识,提高语文素养。学生写作技能与技巧的形成也是学生与文本对话的要点。本文主要以仿写作为学生
对大学生进行系统扎实的当代中国马克思主义理论教育,对于在全社会开展的中国特色社会主义理论体系宣传普及活动,具有重要的促进作用。充分发挥大学生党支部的战斗堡垒作用,