不平衡数据分类方法在财务预警领域应用的比较分析

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:yinmeng6112501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
证券市场的高效有序是保证资金高效融通、经济有序运转的重要前提。退市机制的建立为证券市场提供了过滤功能,在保证证券市场为优秀的企业提供资金的同时,也过滤掉那些本应被淘汰但占用有限资源的劣质公司,这对奠定证券市场健康稳定发展的基础具有重要意义。而我国现行警示标准存在着非数量指标难以操作,而数量指标又不够全面的问题。我国现行风险警示标准的不全面不完善给了许多投机者可乘之机,有些公司甚至对财务指标进行“包装”以逃避被ST标注,这种现状的存在不仅会降低资源利用率,扰乱资本市场的良好秩序,也会使上市公司淡化风险识别意识,误导利益相关者进行决策。因此建立起指标全面、预测准确、泛化能力强的预警系统就显得十分必要。国内外许多学者都在将机器学习的方法应用到财务领域中的方向上做了研究,但实际上,财务预警指标数据大多是不平衡的,而在这个基础上的研究却比较少,进一步的将二者结合并作比较的研究更是空白。本文则在前人的研究基础上,以A股制造业上市公司的财务指标为例,使用了过采样、欠采样、过采样与欠采样结合、人工数据合成的不平衡数据处理方法和逻辑回归、决策树、支持向量机、随机森林、神经网络的机器学习分类方法,并将二者相结合,比较了使用不同不平衡数据处理方法以及不同机器学习分类方法的研究结果,分析了不同模型的预警效果的好坏。经过实证分析,比较研究各个方法的应用效果,这五种方法的F值都不是很高,其中决策树模型的F值最小,最不理想,表明模型预测准确率不高;逻辑回归、支持向量机和神经网络的AUC值都比较大,预测效果比较好,并且其中支持向量机的效果最好,因此从模型层面来说,逻辑回归、支持向量机和神经网络的表现最好,决策树的表现最差,对于本文这种非线性分类问题来说,应尽量避免使用决策树和随机森林的方法。从数据层面看,用人工数据合成方法处理的数据来拟合模型,模型表现最好;用过采样与欠采样结合方法处理的数据来拟合模型的表现次之;而过采样与欠采样数据使用不同的方法,模型表现的好坏有所不同,在逻辑回归中欠采样模型优于过采样模型,神经网络中过采样模型优于欠采样模型,在其他三种模型中表现相当。本文的研究弥补了财务预警研究领域中不平衡数据分类方法比较的空白。在经济生活中也十分具有实践意义。在应用中,若从数据层面处理不平衡数据,则优先选择人工数据合成的方法,通过在少数类样本的邻域内构建新的样本来平衡数据,再进行模型拟合。由于财务预警分析问题多为非线性分类问题,在模型的选择上则优先选择逻辑回归、支持向量机和神经网络的方法。综上所述,在处理数据不平衡的财务预警分析问题时,可先使用人工数据合成的方法使数据平衡,再选择逻辑回归、支持向量机或者神经网络的方法进行模型拟合。
其他文献
信息化时代的到来,使得各式各样的便携式移动终端走进人们的视线,比如笔记本电脑、电子书、多功能掌机等。移动终端通常需要较低且很“干净”的电源电压,因此,需要一个高性能
中国西南地区是一个少数民族集聚的多山地区,喀斯特地貌广泛发育,特殊的自然地理环境下,少数民族用自己的智慧造就了独特的民族文化,人文景观旅游资源优势突出。但是在多山地
目的:探讨饮食疗法在2型糖尿病患者血糖控制中的效果。方法:60例2型糖尿病患者均在药物治疗基础上给予严格的饮食控制,对患者进行饮食健康教育,针对不同患者制定具体食谱,通过对摄
本文从语言学的角度,分析了消息语篇优化传播效果的两大编码策略:语义场理论的运用和义素分析法的运用.
指出已有对唐山地震成因解释的不足,综合分析了唐山地震前后的地震现象.认为唐山及周围地区1973~1975年ML4地震密集,而同一时空范围内3级和2级地震并不活跃是最为显著的地震活
写作教学作为语文教学的重要组成部分,肩负着培养学生全面发展的重要使命。随着时代的发展和观念的更新,写作教学正以全新的面貌朝着时代迈进。虽然写作教学改革的目的是提升
在当今日趋激烈的市场竞争中,赊销已经成为商品销售过程中的常态,由此导致应收账款在企业资产中所占的比重不断攀升。我国是世界主要贸易大国之一,信用赊销是企业,尤其是中小企业的常用手段。伴随商业的发展进步,我国应收账款体量呈现大幅度增长态势,这一结果直接影响中小企业短期偿债能力和现金流量状况。为盘活应收账款,使其转化为现实资产来维持企业的正常运营及发展,利用应收账款质押向商业银行贷款,便成为中小企业融资
针对广东某复杂难选金矿石进行了工艺矿物学研究。结果表明:该含金矿石中主要有价元素为金和银,还具有含碳、高砷、含泥量大的特性。原矿中金除了与黄铁矿等硫化物密切共生外
病例:患者,男,65岁。因“监测血糖升高且控制不佳”于2009年5月11日就诊。入院诊断为2型糖尿病、糖尿病肾病、脂肪肝、胆囊结石。住院期间一直给予胰岛素降血糖。2009年5月16日
基于传统旅游转型与乡村旅游兴起的双重背景,在剖析全域旅游理念及论述全域旅游与乡村旅游间辩证关系的基础上,以全域旅游的视角分析了湖北省大悟县金岭村的旅游现状及发展困