论文部分内容阅读
证券市场的高效有序是保证资金高效融通、经济有序运转的重要前提。退市机制的建立为证券市场提供了过滤功能,在保证证券市场为优秀的企业提供资金的同时,也过滤掉那些本应被淘汰但占用有限资源的劣质公司,这对奠定证券市场健康稳定发展的基础具有重要意义。而我国现行警示标准存在着非数量指标难以操作,而数量指标又不够全面的问题。我国现行风险警示标准的不全面不完善给了许多投机者可乘之机,有些公司甚至对财务指标进行“包装”以逃避被ST标注,这种现状的存在不仅会降低资源利用率,扰乱资本市场的良好秩序,也会使上市公司淡化风险识别意识,误导利益相关者进行决策。因此建立起指标全面、预测准确、泛化能力强的预警系统就显得十分必要。国内外许多学者都在将机器学习的方法应用到财务领域中的方向上做了研究,但实际上,财务预警指标数据大多是不平衡的,而在这个基础上的研究却比较少,进一步的将二者结合并作比较的研究更是空白。本文则在前人的研究基础上,以A股制造业上市公司的财务指标为例,使用了过采样、欠采样、过采样与欠采样结合、人工数据合成的不平衡数据处理方法和逻辑回归、决策树、支持向量机、随机森林、神经网络的机器学习分类方法,并将二者相结合,比较了使用不同不平衡数据处理方法以及不同机器学习分类方法的研究结果,分析了不同模型的预警效果的好坏。经过实证分析,比较研究各个方法的应用效果,这五种方法的F值都不是很高,其中决策树模型的F值最小,最不理想,表明模型预测准确率不高;逻辑回归、支持向量机和神经网络的AUC值都比较大,预测效果比较好,并且其中支持向量机的效果最好,因此从模型层面来说,逻辑回归、支持向量机和神经网络的表现最好,决策树的表现最差,对于本文这种非线性分类问题来说,应尽量避免使用决策树和随机森林的方法。从数据层面看,用人工数据合成方法处理的数据来拟合模型,模型表现最好;用过采样与欠采样结合方法处理的数据来拟合模型的表现次之;而过采样与欠采样数据使用不同的方法,模型表现的好坏有所不同,在逻辑回归中欠采样模型优于过采样模型,神经网络中过采样模型优于欠采样模型,在其他三种模型中表现相当。本文的研究弥补了财务预警研究领域中不平衡数据分类方法比较的空白。在经济生活中也十分具有实践意义。在应用中,若从数据层面处理不平衡数据,则优先选择人工数据合成的方法,通过在少数类样本的邻域内构建新的样本来平衡数据,再进行模型拟合。由于财务预警分析问题多为非线性分类问题,在模型的选择上则优先选择逻辑回归、支持向量机和神经网络的方法。综上所述,在处理数据不平衡的财务预警分析问题时,可先使用人工数据合成的方法使数据平衡,再选择逻辑回归、支持向量机或者神经网络的方法进行模型拟合。