基于集成学习和公平分类的多阶段信用评估模型研究

被引量 : 0次 | 上传用户:chunxi1208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的全球化和我国经济的迅速发展,金融信贷业务也越来越繁荣,已经成为商业银行主要的盈利手段。然而,商业银行若误判了借贷者的信用情况,会导致一定程度的经济损失。因此,商业银行的信用风险管理水平是其业务竞争力水平的重要体现。信用评估是信用风险管理的核心。当前各种信用评估模型均对不同的借贷者存在一定程度的偏见(可能是人为的偏见,也可能是模型的偏见),导致商业银行在使用信用评估模型进行信贷决策时偏爱或歧视某类借贷者,不公平现象时有发生,不利于社会的和谐稳定和公平正义。因此,构建一个科学、准确、公平的信用评估模型已经成为商业银行亟需解决的重要问题。信用评估模型旨在区分借贷者的信用情况。在以往的研究中,已有许多国内外学者对信用评估领域进行深入研究,并提出了大量基于机器学习和多阶段集成学习的信用评估模型。然而,上述模型在数据样本分布不平衡时效果不佳,同时在提取特征信息时也存在特征信息利用不充分的问题。此外,随着人工智能在各个领域的应用范围不断扩大,人工智能的伦理性也逐渐受到学者的关注,如何构建一个能够同时兼顾公平性和精确度的模型成为了新的研究热点。在信用评估领域,仍然有许多特征(如种族和年龄等)会造成模型歧视,影响预测结果的公平性。然而目前鲜有学者在进行研究时将模型的公平性考虑在内。因此,本文基于现有的研究成果,充分分析了影响模型性能的多方面因素,开展了基于集成学习和公平分类的多阶段信用评估模型研究,针对两种不同的信用评估场景,分别提出了不同的信用评估模型。本文的创新点如下:(1)针对追求高精确度的信用评估场景,本文提出了一种基于综合采样和特征转换的多阶段信用评估集成模型。首先,为了使信用评估模型适用于不平衡数据集,本文提出了一种改进的基于模型的综合采样方法,通过减少不同类别的重叠来解决数据不平衡问题;其次,为了充分利用特征信息提取其中的相关性,本文提出了一种基于装袋的特征转换方法以实现特征信息的转换和提取;接着本文结合动态选择方法和堆叠集成方法,提出了一种基于动态集成选择的堆叠集成方法对分类器进行集成,从而构建高精确度的信用评估模型。最后,通过实验验证了上述模型具有良好的预测精确度,能够有效适用于高精确度的信用评估场景。(2)针对需要兼顾公平性与精确度的信用评估场景,本文提出了一种基于混合采样和两层堆叠、面向公平性的多阶段信用评估集成模型(Fairness-aware ensemble model,FAEM),以获得更公平的性能。首先,为减少数据集不平衡带来的偏见,本文提出了一种新的基于混合采样的偏见缓解方法。该方法通过基于交叉验证的欠采样方法去除多数类样本点,并通过基于敏感特征的过采样方法生成新的少数类样本点;其次,为进一步提高FAEM模型的公平性,本文提出了基于堆叠集成的后处理方法,通过修改基分类器在第一层堆叠中的预测结果以缓解偏见,从而构建兼顾公平性和精确度的信用评估模型,并通过实验验证了所提出的模型具有良好的公平性和精确度,能够有效适用于兼顾公平性和精确度的信用评估场景。本文的研究成果是对信用评估领域现有成果的创新和拓展,能够有效缓解人工智能方法在信用评估领域的偏见,提高人工智能方法的公平性,具有良好的理论意义。此外,本文的研究成果能够为金融机构提供适用于不同场景的信用评估模型,提升金融机构的竞争力,加速金融机构的数字化转型,维护社会的和谐和公平,因此具有良好的应用价值。
其他文献
目标资本结构一直以来是企业财务管理中重要的探讨议题。在经典的资本结构理论下,认为企业可以合理安排生产经营所需资金,通过有效的配置股权和债权资金来源比例以充分利用债务利息的抵税效益,从而达到资本结构的最优化,实现企业价值的最大化和资本成本的最小化。但是随着我国经济的发展,资本市场上零负债企业越来越多,这样零杠杆的财务政策显然有悖于修正的MM理论、优序融资理论等经典的资本结构理论,因此也引起了国内外学
学位
在大数据万物互联的时代下,向更高的频段发展带宽更宽、速率更快、通信容量更大的通信业务是大势所趋。当前5G频谱分为FR1:Sub-6GHz频段和FR2:毫米波频段两个频率范围。然而传统通信所用的Sub-6G频段下空闲频谱发展空间受限,且毫米波频段存在传输损耗大、覆盖范围低、关键器件设计难度大以及建设成本和维护成本高等难以解决的问题。当前6-7GHz频段空闲频谱资源丰富,不仅可以为下一代通信系统提供较
学位
党的二十大报告指出,推进新型工业化,加快建设制造强国、质量强国、数字中国。我国作为一个制造业大国,制造业水平领先世界,拥有完备的工业体系和工业品供给能力。在面临重大风险冲击时,制造业是确保我国经济社会发展行稳致远的“压舱石”。然而,我国制造业发展面临着生态环境问题的严峻挑战,其中碳减排问题尤为紧迫。随着数字时代的到来,经济社会发展全面卷入数字化浪潮,制造业被数字信息技术渗透,工业化和信息化协同推进
学位
随着汽车使用人数的剧增,人们急需一个更加智能、安全的驾驶方式,因此辅助驾驶、自动驾驶逐渐成为目前最热门的话题以及科研热点。一个成熟的自动驾驶系统中会配备多种传感器。其中,摄像头因价格低,适用性强被广泛地使用,成了自动驾驶系统中传感器的标配。特斯拉的纯视觉自动驾驶系统就是一个经典的例子。摄像头传感器主要负责感知预测行人车辆,道路交通标识,交通信号灯,以及车道线等。在上述检测任务中,交通标识检测任务面
学位
本文研究了毫米波大规模多输入多输出系统的预编码和信道估计相关技术,具体如下。针对全连接架构下需要使用大量移相器,本文提出了一种混合使用移相器和开关的可变移相器(Variable Phase Shifter,VPS)架构。针对VPS架构,提出了一种混合预编码(Hybrid Precoding Design,HPD)方案即VPS-HPD,该方案交替地优化模拟预编码和数字预编码,并根据信道状态信息来优化
学位
食品安全是国家治理的重要议题和中国式现代化的基础支撑。中国特色社会主义进入新时代以来,食品安全融合保障民生、共同富裕、全民健康和国家安全多重意涵,已经成为治国理政的头等大事,是对执政能力的重大考验,尽显现阶段食品安全问题的复杂性和治理的紧迫性。相应地,寻求有效的食品安全监管理论和监管模式一直是中国行政体制改革和机制创新的内在动因之一,回顾1982年以来的九次国务院机构改革,其中有五次都涉及了食品安
学位
第五代(5th-Generation,5G)移动通信定义了三大应用场景,分别是增强移动宽带(Enhance mobile broadband,e MBB)、高可靠低时延通信(Ultra-reliable and low latency communication,URLLC)和大规模机器类通信(Massive machine type communication,m MTC)。现有的正交多载波调制
学位
2014年“11超日债”因无法按时兑付利息构成实质性违约,打破了我国债券刚性兑付的历史。自此,我国债券市场违约事件频发,债券违约也进入常态化阶段。在人工智能时代,机器学习方法已被成功应用于量化金融和风险管理方面。在债券违约日益凸显的背景下,如何利用机器学习模型全面、准确的评估和预测债券的违约风险,建立适合我国的债券违约预测模型,保护合作者合法权益,更是是科技赋能金融、用技术防范化解金融问题的核心环
学位
图像是一种常见的信息存储形式,其不仅能直观地表示大量相关的信息,还具有易于存储和传输等优势。由于各种环境和信道因素的影响,图像在采集、压缩和传输过程中难免受到噪声的干扰,导致图像信息失真或丢失。同时,因为噪声的存在,可能对后续的图像处理任务,如图像分类产生不利影响。真实噪声的无噪声标签也不易获取。因此,如何依靠少量训练样本并从含噪图像中恢复出有意义的信息是当今图像处理领域内的一个重要问题。为了解决
学位
架空线路是国家电力系统中负责电能输送的一个重要组成部分,长期经历着风吹日晒、电闪雷击、雨雪、污秽及沉陷等外界环境因素的侵害。而绝缘子作为架空线路最核心的元器件之一,关系到输电线路能否可靠运行,因此,对绝缘子自爆缺陷的检测尤为重要。本文针对现有绝缘子缺陷检测方法存在的作业周期长、效率低、安全性低等问题,结合新型人工智能技术设计基于卷积神经网络的绝缘子缺陷识别系统,实现了快速、准确的绝缘子缺陷检测功能
学位