正则化机器学习算法及其财务预警应用研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:kekexil123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习算法已广泛应用于财务危机预警建模。然而,随着对机器学习算法的不断深入研究,发现其在构建模型时存在过拟合和模型系数非稀疏问题,所以考虑将统计学习理论中的正则化技术引入到机器学习算法中,从而建立正则化机器学习算法的预警模型。本文主要针对逻辑回归(Logistic Regression,LR)和支持向量机(Support VectorMachine,SVM)提出各种改进的形式以及给出相应的求解算法,并且利用改进后的算法来构建危机预报模型。首先,介绍了课题研究背景与意义,并简要归纳了国内外预警建模方法的研究现状。其次,较系统地介绍了LR算法和SVM算法,同时选取了2010年至2012年间的78家A股制造业上市公司作为样本公司,而且还选取了29个财务指标变量以及确定了样本数据年份的选取。接着,针对LR建模时存在过拟合和模型系数非稀疏问题,提出了平滑削边绝对偏离(Smoothly Clipped Absolute Deviation,SCAD)惩罚LR的预警模型,并就该模型的求解给出了实现算法,而且利用收集到的财务样本数据验证了SCAD-LR模型更具优越性。还有,针对L1正则化LR问题的难解性,设计了一个高效的内点法,并通过仿真实验说明了L1-LR模型的稀疏性和分类效果相对更好以及设计的内点法相对较优。然后,针对传统SVM无法很好地刻画变量间的相关性,提出使用经典高斯函数的参数推广形式——q-高斯函数作为SVM的核函数,并将q-高斯核SVM用于构建预警模型。在进行实验之前,为剔除不显著的指标变量,对样本数据进行了显著性检验,而后将显著变量的数据用于对比实验,结果表明q-高斯核SVM比高斯核SVM具有更高的预报精度和更低的两类错误。最后,为克服传统SVM存在的对离群点敏感、支持向量个数多以及分类面参数非稀疏问题,提出了SCAD惩罚截断hinge损失SVM的预警模型,并就该模型的求解设计了一个迭代更新求解算法。利用样本数据进行实验,结果表明SCAD-TSVM算法构建的模型在稀疏性、预报精度等方面要优于SVM的其它变形算法的模型。
其他文献
随着我国市场经济的快速发展和国际竞争力的不断加强,民间投资呈现活跃、上升的势头。但是,由于近年国内外经济下行压力较大,部分中小企业经营困难,企业拖欠工资的情况时有发生,经
目的调查急诊老年脑卒中患者心理应激状态。方法选择2019年1月至12月经沈阳市急救中心急诊救治的老年脑卒中患者83例(急诊脑卒中组),对照组为同期在社区卫生服务中心接受健康
目的研究特布他林/布地奈德溶液联合吸入对新生儿哮喘呼气流速改善的临床护理价值。方法随机选择2012年1月至2014年4月接受特布他林联合布地奈德溶液吸入治疗的新生儿38例,随
群组运动模式分析中,各成员节点之间的聚集程度是一个非常重要的描述指标,是分析和评估群组行为方式和行动效果的重要因素。在基于凸包重心群组运动模式分析方法基础上,定义
医用电磁定位系统,以电磁场理论为基础,结合了应用数学、计算机、信号采集与信号处理等信息技术,可在医疗过程中提供三维定位,指导医师实施相关的治疗,成为医疗仪器研究的一
经典名著的当代传播是出版业的重要组成部分(时间限定在当代:1978年以后),它担负着传承中国传统文化的责任和使命。我国五千年的历史文化精髓为我国的出版业提供了丰厚的资源,且在