基于随机森林算法的个人信用评估研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:jiqt001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信用消费经济模式的发展,人们的交易方式发生了巨大的改变。有数据表明,目前在银行等信用机构中,个人贷款的份额在不断增加,有逐年超越企业贷款的趋势,但是随之而来也会带来大量的信用风险问题。主要原因是中国目前信用评估的发展尚不成熟,银行等相关部门常常会受到欺诈现象带来的恶劣影响,因此为了快速而有效地对个人信用风险进行评估和预测,需要建立合理科学的分析模型。商业银行等机构对客户进行放贷时,对客户的一系列个人信用指标建立相应的指标体系,在已建立的指标体系上建立模型进行预测,最终希望判断出哪一种算法更能准确的预测出结果。随机森林(Random Forest)是一种基于决策树的典型分类算法,该算法的优点就是泛化能力强,不容易造成过拟合问题,同时该算法对缺失值不敏感,且具有较好的容噪能力,因此,相较于传统的单分类器算法,随机森林算法被证明是处理信用评估问题的有效算法。
  本文提出了一个基于随机森林算法的个人信用评估模型,主要是从特征选取、数据不平衡、参数优化以及投票机制这四个方面对模型进行优化,以更准确的对个人信用进行分类。具体内容如下:
  1、由于信用评估数据集中存在数据冗余与不平衡等问题,在数据处理阶段研究了一个两阶段特征选择算法,该方法主要是在特征选择阶段选择对分类结果影响较大的特征。采用K-Means算法进行类分解,以达到平衡数据的效果。为了减少传统随机森林算法中的两个参数n_estimators、max_features对分类结果的影响,运用遗传算法改进了K-Means算法以及随机森林算法的参数设计,提高了模型的分类性能。
  2、引入了精确度加权随机森林模型,改善了随机森林的众数投票机制(将精确度作为每一棵决策树的权重)。选取UCI数据集中的German数据集进行仿真实验,实验结果表明了,随机森林算法相比于其他单一分类算法的效果更好,并且提出的组合优化算法在预测精度上效果更好。
其他文献
随着经济全球化的推进,企业与企业之间的竞争也在逐渐加剧。供应链上下游成员之间不再是相互独立的个体,而是彼此相互依存、息息相关的一个整体。生产力的快速发展,导致目前市场上消费者的需求也逐渐呈现出多元化与个性化,单一产品的市场需求可能波动较大。因此,与位于上游的制造商相比,靠近消费市场需求端的零售商往往更加了解该产品在市场上的实际需求情况,并且根据市场上多变的需求,零售商衍生出灵活适应市场需求的能力:当市场需求较高时,为了不错过销售机会,零售商往往会投入较多的资源,因此,零售商所呈现出来的最高促销能力较强;当
供应链上存在多个成员,成员间协同合作才能真正实现共赢。不过很多供应链成员为了自身的安全和利益,为了有效避免供应链的风险会隐藏其成本信息,从而会有信息不对称现象,使得供应链的系统效益无法达到最大。另外现实情况中,供应链上也会存在各种风险,例如销售剩余风险,生产能力不足风险,订单量不足风险等,这些问题会使得供应链上的企业决策者存在损失规避的心理。损失规避指的是决策者在面对相同的损失和收益时,会偏向于对损失进行规避,即会夸大损失,进而使得原本风险中性时的最大化利润决策点发生变化,无法实现供应链的最大化利润。
大数据时代,万物互联的互联网+技术让信息更加共享化。电影产业作为大众娱乐项目发展迅速,影片数量逐年增加,电影信息过载现象日益加剧,用户很难在海量视频中寻找到喜好的视频观看。因此,如何提升用户体验,通过用户信息、影片信息、电影打分等资源数据分析构建用户画像,为每一位用户匹配感兴趣的影片成为业界视频APP和网站非常关心的问题。
  传统推荐算法模型存在推荐精度不高、数据稀疏性、新用户冷启动等问题。为了解决推荐算法中的几个经典问题,本文提出了一种基于影片剧情文本数据、用户属性以及观看影片行为历史数据的混合
电子商务的飞速发展使得专业物流配送能力不能满足最后一公里需求,共享经济理念下的众包物流模式通过共享社会配送人员能力,服务于物流配送订单需求,成为专业物流配送能力的有力补充。但最后一公里配送需求的高时效性和众包物流配送能力的社会性等特点,带来新的管理问题:众包物流人员可以自主选择平台和订单,因此市场需求和即时配送服务能力的供需双方均具有较大的不确定性。如何制定有效的众包物流配送价格和对社会配送人员的激励力度,才能调动其积极性来满足众包物流平台订单需求的配送能力?随着众包物流的发展,众包物流平台在发展初期和发
近几年来,中国服装制造业面临着前所未有的挑战。国内,人口红利趋于消失;国外,东南亚服装制造业开始崛起。与此同时,服装市场呈现交货期短、个性化定制等特点。这一切变化对服装制造业提出了新要求,亟待改变生产模式以应对服装市场的快速响应和个性化需求。在这一情形下,逐步在制造业中兴起的共享经济模式为服装制造业带来了转机,同时,电子商务与“互联网+”的推动为服装制造业共享提供了可行性。
  本文基于中国服装制造业以及共享经济的背景,从云制造平台视角,研究服装企业制造资源共享的演化博弈行为,并考虑平台影响能力和平
斯攀瓦是泰国的度假胜地之一,处于攀瓦角顶最高点,可以俯视普吉岛东南端的壮丽美景,领略到整个攀瓦角半岛的风景。斯攀瓦酒店是普吉岛最好的地理位置之一,是您回归宁静并享受华贵人生的绿洲。  斯攀瓦酒店坐落于海拔40-60米处,是东西山脊沿线上的海角之巅。它将周围岛屿及安达曼海域的美丽景色尽收眼底。建筑融合了当今热带的设计风格及以海洋为主题的室内装饰,独特的设计与普吉岛的环境浑然一体,在简单和朴实中为您提
期刊
著名导演伍迪·艾伦曾说:“生活当然是悲剧,所有的结尾都不愉快。”  另一位著名话剧导演林奕华也调侃自己:“悲观在我的脂肪里。”而拨开文人天生敏感造就生活意象的坎坷之外,回到创作上,林奕华自然的把自己排除在大众之外。在他的创作世界里,没有主流与非主流之分。看似不争的态度背后,是一个对人对事认真到几近苛刻的严格导演。他擅长探究现象背后的原因,在创作上绝对拒绝“差不多”的态度。  一个男人的两扇门  和
期刊
90后是争议的一代,特别是90后女孩。好像没有特立独行,不引来旁人不理解的侧目,就不足以配得起这个充满各种“骄傲”的年岁。再说娱乐圈里硝烟滚滚,部分女明星都开始愿意以“哥”或者“爷”自诩,好像女人的媚态加上男人的语境,就成了给力、带劲的理想装备,似乎只有这样才能让自己成为一道独特的风景线。如果把90后和娱乐圈这两个标签加在一起,是否有点儿令人“捉急”?  同时拥有上述两个特点的戴芊芊彻底打消了我们
期刊
近几年,经济学兴起了对于信息设计的研究。与其相对于的是机制设计,区别在于信息设计不是依靠支付的转移去推动决策者的行动,而是依靠设计信息,去影响决策者的对于某市场信息的信念,从而影响他做出的决策,使设计者自身从中获利。为了说服决策者者采取对设计者更有利的行动,设计者可以制定一种策略,在决策者做出选择之前,向决策者透露全部或部分的私人信息,从而改变决策者的认知,继而改变决策者按照个人目标最优所做出的决策,使其符合设计者的既定目标。
  另外,随着现代科技的快速发展,市场需求变得越来越具有不确定性,企业面
伴随经济发展和社会服务需求,家政服务业发展的步伐日益加快。截至2019年初,家政服务从业人员已超过3000万人,家政市场需求也同样呈现出多元化的高增长态势,但是随之而来的家政服务业服务数量和质量结构等方面问题也逐渐凸显,这些问题使得家政服务业一度陷入结构性的失衡困境。
  互联网家政服务业的结构性失衡问题主要矛盾集中在家政服务人员的分级考量上,这一分级考量问题本质则是大数据环境背景下的专业性分类问题。本文为实现互联网家政服务人员的专业性分类问题,基于Y互联网家政服务企业的详细家政服务人员数据库,根据