论文部分内容阅读
机器学习算法已广泛应用于财务危机预警建模。然而,随着对机器学习算法的不断深入研究,发现其在构建模型时存在过拟合和模型系数非稀疏问题,所以考虑将统计学习理论中的正则化技术引入到机器学习算法中,从而建立正则化机器学习算法的预警模型。本文主要针对逻辑回归(Logistic Regression,LR)和支持向量机(Support VectorMachine,SVM)提出各种改进的形式以及给出相应的求解算法,并且利用改进后的算法来构建危机预报模型。首先,介绍了课题研究背景与意义,并简要归纳了国内外预警建模方法的研究现状。其次,较系统地介绍了LR算法和SVM算法,同时选取了2010年至2012年间的78家A股制造业上市公司作为样本公司,而且还选取了29个财务指标变量以及确定了样本数据年份的选取。接着,针对LR建模时存在过拟合和模型系数非稀疏问题,提出了平滑削边绝对偏离(Smoothly Clipped Absolute Deviation,SCAD)惩罚LR的预警模型,并就该模型的求解给出了实现算法,而且利用收集到的财务样本数据验证了SCAD-LR模型更具优越性。还有,针对L1正则化LR问题的难解性,设计了一个高效的内点法,并通过仿真实验说明了L1-LR模型的稀疏性和分类效果相对更好以及设计的内点法相对较优。然后,针对传统SVM无法很好地刻画变量间的相关性,提出使用经典高斯函数的参数推广形式——q-高斯函数作为SVM的核函数,并将q-高斯核SVM用于构建预警模型。在进行实验之前,为剔除不显著的指标变量,对样本数据进行了显著性检验,而后将显著变量的数据用于对比实验,结果表明q-高斯核SVM比高斯核SVM具有更高的预报精度和更低的两类错误。最后,为克服传统SVM存在的对离群点敏感、支持向量个数多以及分类面参数非稀疏问题,提出了SCAD惩罚截断hinge损失SVM的预警模型,并就该模型的求解设计了一个迭代更新求解算法。利用样本数据进行实验,结果表明SCAD-TSVM算法构建的模型在稀疏性、预报精度等方面要优于SVM的其它变形算法的模型。