论文部分内容阅读
全球接连发生财务舞弊案件,从早年美国的安然、意大利的帕玛拉特、日本的奥林巴斯、我国的银广夏等,到近几年我国的绿大地、九好集团、万福生科和康美药业等,国内外的财务舞弊案件屡禁不止且舞弊手段愈加多样。注册舞弊审查师协会(ACFE)发布统计数据显示,2018年审查出的财务舞弊案件数量比2016年增长了11.6%,涉损金额高达70亿美元[1]。我国资本市场建立时间虽然不长,同样也存在诸多财务舞弊案件。上市公司的财务舞弊行为不仅影响了公司自身的发展,也影响了债权人和投资者的利益,阻碍了我国资本市场经济的稳步发展,对社会经济造成严重影响。因此财务舞弊问题一直是学术界研究的难点和热点。本文将数据挖掘技术应用于上市公司财务舞弊识别的研究中,在对现有相关文献进行梳理之后,以2009年至2018年我国沪、深A股上市公司的年报数据作为研究对象,从因财务舞弊受到中国证监会、上海和深圳证券交易所处罚的上市公司中选取舞弊样本,并根据一定标准以1:1的比例选取非舞弊样本,经过筛选最终选取了684家公司数据作为研究样本。在变量选取上,本文以舞弊风险因子理论为基础,根据上市公司常用的财务舞弊手段和现有文献研究成果,确定本文的变量指标体系。通过支持向量机、BP神经网络和随机森林三种数据挖掘技术分别构建财务舞弊单一识别模型,并在此基础上将三种数据挖掘技术结合起来,构建了一个识别效果更佳的财务舞弊综合识别模型。通过研究,本文得出的基本结论是:(1)在财务舞弊单一识别模型中,基于支持向量机的财务舞弊识别模型识别效果最佳,其次分别是基于BP神经网络和基于随机森林的财务舞弊识别模型。三个单一模型的总体识别准确率都在69%到75%之间。(2)在财务舞弊综合识别模型中,本文通过赋予每个单一识别模型不同权重的方式,将支持向量机、BP神经网络和随机森林三种数据挖掘技术相结合,构建了财务舞弊综合识别模型,经过对模型的评估检验,结果发现数据挖掘技术下的财务舞弊综合识别模型比单一识别模型有更好的识别效果。本文的贡献在于将数据挖掘技术运用于财务舞弊识别模型的构建中,构建了基于支持向量机、BP神经网络和随机森林三种数据挖掘技术的财务舞弊识别模型,并对模型进行综合,在财务舞弊单一识别模型基础上建立了财务舞弊综合识别模型,其准确度达到78%,精确度达到80%,召回率达到77%,F1分值达到78%,经过与单一识别模型的对比分析,最终得出数据挖掘技术下的财务舞弊综合识别模型比单一识别模型具有更好的识别效果的结论。