基于有监督机器学习模型的A股上市公司财务预警研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:awzh963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着市场化改革的深入以及对外开放的进一步扩大,我国企业面临着日趋激烈的竞争。在经济下行压力日益增强的宏观背景下,国内企业更容易陷入财务困境,出现财务危机,影响企业的正常经营。企业作为市场经济主体,若大量企业发生严重的财务危机将会影响市场经济的正常运转,同时对就业产生负面冲击,甚至产生严重的社会性影响。因此企业需要做好风险管理,增强风险控制技术,及时调整经营策略,减小发生财务危机的可能性。从现实情况来说,对企业财务危机进行合理量化与准确预测具有较强的实际意义,提前预测财务危机的发生有助于企业及早发现风险隐患,及时调整经营策略和采取必要措施以防止财务危机的实际发生,进一步地,还能避免产生连锁的负面影响。对于财务危机的预测,从最初的单变量预测模型,到现在机器学习模型的广泛应用,不同时期的学者进行了各具特色研究,提出了高效的解决方案。目前流行的企业财务危机预测方法主要是机器学习中的监督学习方法。通过对历史数据的学习,模型可以从数据中挖掘得到财务风险的特征及规律,以对企业可能面临的财务危机进行准确预测。机器学习是从历史数据中进行学习,因此数据情况对模型性能有显著的影响。从现实情况来看,发生财务危机的企业占全体企业的比例较小,由此导致的样本非平衡问题较为严重。在样本非平衡的情况下,监督学习模型倾向于学习多数类样本,更容易忽视少数类样本,基于此得到的模型对危机企业的预测能力非常差,甚至不如随机猜测。针对该问题本文采取了SMOTE-ENN方法进行优化,改进了监督学习模型,降低了非平衡性问题对监督学习模型的影响。常见的监督学习模型有逻辑回归、支持向量机和决策树等。2016年陈天奇博士提出了XGBoost模型,该模型一经提出就由于优秀的性能表现而广受欢迎,经常被用于各类人工智能项目及学习竞赛。在查阅相关文献资料后,通过模型之间的对比衡量,本文最终选择以XGBoost模型构建A股上市公司财务预警模型,并以逻辑回归等监督学习模型作为对照模型,同时结合SMOTEENN方法构建优化后的SE-XGBoost和SE-Logistic模型。本文可概括总结为五个部分。第一部分奠定了本文的写作基础,主要内容包括课题背景及写作思路等,此外本部分还回顾了国内和国外已有的研究结论,为后文的顺利写作提供了有益参考。第二部分是理论和技术基础介绍部分,本部分对上市企业财务危机预警和监督学习相关理论技术进行了简要介绍,为后文所用方法与理论做铺垫。第三部分是特征指标和样本的选择与处理,本文从多个方面选择了具有概括性和指示性的32个特征指标,同时选择了A股市场上具有代表性的企业作为样本,然后对特征指标进行了主成分分析,从32个特征指标中提取出了12个主成分因子,为后面实证做准备。第四部分是本文的实证分析部分,在进行实证分析之前,本文利用SMOTEENN等方法构建了样本分布平衡的训练集,再让模型从平衡训练集中进行学习,并用测试集检验模型预测效果,基于F1、AUC等指标对模型进行对比分析,总结实证研究结果。最后一部分对全文研究结果进行了总结,并展望了下一步研究方向。本文的创新在于针对样本非平衡问题进行了专门处理,并对比了不同处理方法对模型性能的改善程度,同时对企业财务危机发生时点之前的数据都给予了关注。出于全面性及严谨性考虑,本文还实证检验了XGBoost和对照组模型在原始训练集和优化后的训练集上的学习效果,探究了不同时间区间的数据、不同的优化方法对模型的差异性影响。研究结果表明,在财务危机发生前3年,危机企业和正常企业在偿债能力、经营能力、盈利能力等方面就已经出现了显著的差异,说明构建高效、准确的模型对企业财务危机进行预测具有较强的可操作性与实际意义。此外,本文还发现经过SMOTE-ENN和其他算法优化后的训练集训练出的模型不论是对危机企业的预测能力还是总体的预测能力都较未优化训练集训练出的模型有显著的提升,表明SMOTE-ENN等优化算法对模型性能具有较大的改善作用,并且本文还发现SMOTE-ENN是更加中性的优化算法。通过对不同时间区间样本的实证结果分析,本文发现T-1年样本预测准确率最高,T-2年样本次之,T-3年样本预测准确率最低,表明样本指标的时效性对模型预测准确率也有显著的影响,为了提高模型的预测精度,需要选择具有较高时效性的数据。
其他文献
近年来,随着风险投资行业的不断发展,这种的融资方式开始受到广泛关注。它不仅能够改善中小企业的融资环境,为创业企业提供发展资金,而且其积累的行业经验、专业的管理技能和丰富的社会资源网络也能够为企业提供有价值的增值服务。但是,引入风险投资通常也会改变企业的股权结构,影响企业的公司治理能力。因此,正确的了解风险投资对企业的公司治理影响效果,对企业在考虑引入风险投资时具有重要参考意义。本文首先从积极股东假
基于股票市场公开,公平和公正的三大原则,高质量信息的披露减少了市场上的信息不对称和交易成本,有效地发挥了资本市场的有效性,并改善了资产的有效配置,对资本市场持续稳定的发展至关重要。自1990年以来,作为影响资本市场效率的关键问题,上市公司信息披露的质量已成为国内外学者所研究的独立课题。上市公司作为披露的主体,其所做出的信息披露状况是否会影响基于上市公司财务报表和业务绩效预测的分析师预测,是否会影响
我国汽车行业在最近十年飞速发展,产销量连续十年蝉联全球第一,汽车的交易量和保有量都大幅增加。较大的汽车存量市场为二手车产业提供了供给支持,人们对二手车的接受度和认可度也在逐步提高。根据国家统计局发布的数据,我国的私人轿车保有量从2012年的1.2亿辆增加到2019年的2.5亿辆,二手车交易量从2012年的479万辆,增加到2019年的1492万辆。二手车交易量虽然增幅也较大,但其占整体汽车交易的比
1995年以来,股权质押因其优势,逐渐受到市场的认可。然而,随着我国股权质押规模的不断扩大,其带来的风险也不断突出,对中小股东利益造成影响。本文以康美药业为例,从委托代理理论和信号传递理论两个影响路径出发,分析案例公司控股股东股权质押对中小股东利益的影响。委托代理理论角度下,本文通过对康美药业控股股东股权质押动因进行分析,发现其股权质押行为存在掏空动因。通过进一步识别,发现康美药业控股股东存在过度
中国美学素来有“天人合一”的思想观念,传递着人们对真、善、美的追求。无论是剪纸艺术还是拼布艺术都将“天人合一”作为追逐的目标。剪纸艺术作为中国传统民间艺术,有着独特的地方色彩和民族特色,兼具实用性与审美功能。拼布艺术也在这一思想体系中不断发展完善,中国传统拼布体现了人们取于自然,归于自然的生活方式,在纷乱中寻求统一,具有鲜明的中国美学思想特征。本课题将染色剪纸元素融入到现代拼布艺术中,对其在拼布艺
形象隐喻是指因两个形象具有相似的特征而用其中一个形象去描述或说明另外一个形象的认知方式和认知机制。然而,目前学者们对形象隐喻的关注度不高。中国的歇后语是一种独特的语言现象,包含了大量的形象。但前人的相关研究主要集中在歇后语的语义隐喻和语音隐喻,歇后语中的形象隐喻很少关注。本研究将歇后语中的形象隐喻定义为基于源域中的歇后语形象和目标域中的语境主体形象的相似性的概念隐喻。本研究基于该定义从杨宁主编的《
近年来,随着我国经济的发展与波动愈加复杂,法院受理的企业破产纠纷案件数量明显增加,企业在破产前往往伴随着迟延履行的行为,而随着债权人的法律意识逐渐增强,曾经被理论界与实务界较为忽视的企业破产受理前迟延加倍利息的清偿顺位问题在实务中逐渐凸显出来,成为了司法实务中一类颇具争议的典型案件,愈加受到关注。债权人申报的企业破产受理前的迟延加倍利息该如何认定其清偿顺位,《中华人民共和国破产法》与最高人民法院司
文章以2012-2017年沪深两市A股上市公司为样本,以手工搜集整理的年报可读性数据,基于管理层自利的视角,探讨公司绩效与年报可读性的相关关系,并进一步探讨机构投资者持股对于上述关系的治理作用,而后通过产权性质分组、控股股东能力大小分组研究机构投资者持股作用在不同主体的影响大小。同时,本文还探讨了管理层基于公司绩效操纵年报可读性的背后动机与管理层超额薪酬之间的关系。研究发现上市公司绩效与年报可读性
随着经济全球化的不断发展,我国服务业对外开放日益深化,我国运输服务出口贸易得到了迅速发展,运输服务在服务贸易中的比重不断上升,其地位和作用日益提高。目前我国运输服务贸易在服务贸易中占比第二并处于世界第二的位置,运输服务出口总体规模较大但是处于长期逆差的状态,落后于服务出口和货物出口贸易。因此,中国运输服务出口国际竞争力有待进一步提升。本文首先以国际竞争力评价的相关理论和方法为指导,运用MOR,TC
在经济"新常态"及经济转型升级的大背景下,我国经济各部门的增长发生了分化,部分传统产业竞争加剧,盈利难度加大,部分上市银行的持续盈利能力有所下降。自上世纪七十年代起,发达国家的商业银行一直非常重视收入的不断优化,降低了传统以存贷利率差为主的经营方式风险。然而,在我国商业银行,受监管部门对存款利率和贷款利率进行限制,对非利息业务的发展一直没有起到积极的作用,近几年来,我国对利率市场化改革的不断深入,