基于XGBoost与吉布斯采样的财务危机预警研究

被引量 : 0次 | 上传用户:kjasdg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济增速逐渐放慢,上市公司面临的经济下行的压力也与日剧增。制造业作为我国的支柱产业,因此制造业公司的财务状况直接关系着我国经济命脉的安危。因此,针对制造业上市公司建立一套高效的财务危机预警指标体系以提前预警公司的财务状况具有十分重要的现实意义与应用价值。目前国内外关于财务危机预警的研究成果十分丰富,但仍有以下几点需要改进:首先是特征选择的方法,因为在大数据背景下往往存在特征维度过高而观测样本有限所面临的算法不收敛问题;其次是财务危机预警模型,因为传统的统计模型往往存在假设条件过于严格且预测精度不高的问题;最后是可解释性方面,因为复杂的集成学习模型虽然预测精度高但也存在不可解释的问题。因此,本文从这几点出发:首先引入吉布斯采样来对特征进行选择,不仅可以刻画出特征之间的非线性相关关系,而且也解决了样本量不足与特征过多的矛盾;其次引入XGBoost模型来构建财务危机预警模型,该模型可以同时运行大量的表格数据,并且准确度和泛化能力较好;最后引入SHAP可解释性框架,对所选择出的特征做可解释性分析,深入研究每个特征对样本的具体推动作用。本文以中国制造业2116家非ST上市公司以及125家ST公司作为研究样本,确定了76个财务指标以及14个非财务指标来构建初始的财务危机预警指标体系。本文引入吉布斯采样对初始指标体系进行筛选,并与传统的基于IV值与相关系数的特征选择方法对比。根据各自所选择的指标构建XGBoost模型,结果表明,使用吉布斯采样选择的指标所构建的模型预测性能更强。最后,本文借助SHAP可解释性框架详细分析了指标影响预测结果的过程。此外根据指标的部分依赖图找出指标各自的预警区间,这对企业健康发展以及为利益相关方提供决策依据都具有重要的意义。
其他文献
随着国内经济高速发展和人民生活水平不断提高,餐饮行业迎来了飞速发展。同时近年来各地餐饮行业频繁发生的食品安全事件也暴露出该行业广泛存在较高的食品安全风险,一些国内外知名餐饮品牌连续出现了食品安全违法行为,尤其是河南省新乡市某地校园供餐单位引发的学生集体中毒安全事故,成为了百姓关注的热点,引发全社会对食品安全问题的担忧。我国目前已进入新时代高质量发展阶段,需要不断完善共建共治共享的社会治理制度,基层
学位
表皮毛是由植物的表皮细胞形成的一种特化的单细胞或多细胞结构,是植物地上表皮细胞的延伸。表皮毛的形态结构具有多样性,因此造就了其功能的多样性。表皮毛不仅在植物响应生物胁迫和非生物胁迫中发挥重要作用,具有多种保护功能,而且有的表皮毛还具有重要的经济价值。例如,棉花作为一种世界上重要的经济作物,其经济价值主要体现在棉纤维上。因此,揭示表皮毛起始和发育途径中的关键调控因子和调控机制,具有重要的理论意义和应
学位
CRISPR/Cas9编辑技术由于其简便性和高效性,迅速成为了动植物领域基因功能研究的新方法。在植物基因编辑应用中,常见的CRISPR组分投送方式为农杆菌介导的Ti质粒叶注射法、基因枪轰击法和原生质体转染法等。这些方法虽然可以准确的将基因编辑组分Cas9以及sgRNA投送到靶细胞的细胞核中,但是想要得到稳定遗传的突变体后代,需要通过耗时耗力的组培再生。而使用植物RNA病毒载体投送CRISPR编辑组
学位
大肠杆菌Rec A的同源物Radiation sensitive 51(RAD51)蛋白,最早在酿酒酵母中发现,是同源重组的中心重组酶,在减数分裂与有丝分裂中均起作用。RAD51具有依赖于DNA的ATP酶活性,可催化DNA链交换,对于DNA损伤修复、同源重组和基因组稳定性的维持非常重要。当前,全球气候变暖对植物的生殖发育影响极大,已成为作物减产的主要原因之一,提高植物高温胁迫下DNA损伤修复的能力
学位
近年来,新媒体技术的迅猛发展加速了网络上谣言的大规模传播分享,对于社会及个人都造成了严重的负面影响。采取有效的控制措施是改善社交网络生态系统质量,为人们营造一个安全可信的网络环境的重要手段。在社交网络谣言控制领域,寻找具有最大传播影响力的重要节点对于有效控制谣言传播具有重大现实意义。论文通过引入基于D-S证据理论的信息融合技术,系统地研究了多特征融合的节点重要性度量问题,以及重要节点在社交网络谣言
学位
人工智能和金融科技的发展,对金融产品和业务模式产生了颠覆性的影响,为人们带来便利的同时也产生了大量的信用风险问题。因此,如何高效准确的评估和预测信贷违约风险成了银行等金融机构亟需解决的问题。而通过对借款人基本属性、借贷相关等海量信息进行归集,并利用机器学习算法建立风控模型,是当前金融风控领域研究的一个主流方向之一。本文基于串行融合策略和Stacking模型融合思想,提出了深度异构Stacking模
学位
三支概念学习是三支决策、形式概念分析和认知学科的交叉研究领域,如何将三支概念学习理论应用于实际问题,一直是一个有意义且亟待解决的问题。经过研究发现,将三支概念学习应用于图像分类任务,需要解决以下三个问题:1)图像原始数据不符合三支概念学习中所需要的形式背景和补背景的定义;2)三支概念学习如何应对图像集对应形式背景维度较大的问题;3)如何利用三支概念包含的丰富信息进行图像类别判断。针对上述问题,给出
学位
近年来,非预期的大规模人群聚集造成的安全事故屡屡发生。人群计数作为人流量管理的重要参考标准之一,利用计算机视觉技术从图像或视频中及时获取准确的人群数量以及分布情况,在安防预警、公共管理、城市规划等领域发挥着重要作用。随着深度学习技术的快速发展,基于卷积神经网络的人群计数方法取得了良好的性能。然而针对复杂场景中人群的非均匀分布和行人尺度剧烈变化的问题,现有的人群计数方法在性能上仍然面临着巨大的挑战。
学位
背景与目的:吸烟是诱发人类肺癌等疾病重要危险因素之一。前期研究表明,吸烟对肠道菌群的多样性和菌群群落分布具有显著的影响。此外,吸烟可提高血清中的炎症水平,导致全身性炎症反应。然而,目前关于吸烟对于肠道菌群影响的研究大多处于属水平,缺乏在基因和功能层面的深入研究;此外,在吸烟人群中,改变的肠道菌群与血清中炎症水平的相关性研究尚不多见。本研究通过宏基因组测序技术,在种水平上探索吸烟对肠道菌群的影响,了
学位
目的血脂异常增加了心血管疾病的患病风险,它以高水平总胆固醇(TC)、甘油三酯(TG)、低密度脂蛋白胆固醇(LDL-C)和低水平高密度脂蛋白胆固醇(HDL-C)为特征,因此寻找影响血脂异常发生发展的可干预因素是预防心血管疾病的重要课题。睡眠是机体一种极其重要的、不可缺少的生理活动,良好的睡眠对人的身体健康起着重要的积极作用。作为一种可调节生活方式,睡眠与血脂异常的关联受到人们的关注。以往关于夜间睡眠
学位