浅谈数据挖掘技术在财务舞弊识别中的应用及发展路径

来源 :今日财富 | 被引量 : 0次 | 上传用户:ylhly200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:回顾了上市公司产生财务舞弊的原因和识别方法,在此基础上介绍了现阶段常用的大数据挖掘方法以及研究成果,对大数据挖掘的发展前景作了一定的评述。
  关键词:上市公司财务舞弊;数据挖掘;神经网路
  根据中国《独立审计具体准则第8号》,财务舞弊被定义为会计报表不实反映公司真正经济业务的故意行为。财务舞弊由于收益巨大,很多上市公司无视法律,使用编造财务数据,虚增利润等一系列的财务舞弊手段给投资人带来了巨大的损失。从银广厦的利润造假到万福生科的财务造假,各种舞弊手段隐蔽而复杂。目前审计主要依赖人工检查的方式审核财务报表,由于审计人员的经验及主观判断的不同,对于相同的财务报表审计结果也不同,再加上财务造假手段多样,涉及会计科目繁多,人力成本受限,使得审计质量不高。在“互联网+”及大数据背景下,企业可以通过大数据挖掘技术分析公司海量数据和财务舞弊之间的关系,并以此识别公司的财务舞弊行为。
  一、上市公司财务舞弊动因理论
  Bologna和Lindquist提出了会计领域内的冰山理论,他们认为浮在海平面之上的一部分是能被直接观察的企业内部管理方面的问题,比如企业目标、组织架构等;位于海平面之下的部分则是财务造假者蓄意掩饰的内容,这部分内容难以被揭示,包括管理层的主观意愿、个人记录等。
  反舞弊专家Albrecht则提出财务造假三角理论,即产生财务舞弊的诱因有三个,第一是财务舞弊产生的动机,包括不能扭亏为盈公司将终止上市,公司出现财务危机导致融资困难,或者公司现金流面临枯竭等,这一系列的外因是管理层受到的外在压力。而融资压力是我国上市公司面临的最大问题之一,无论公司是需要上市、增发股票还是银行贷款,都需要达到财务上的硬性指标。国内的学者在此理论基础上也提出了财务造假的其他成因,包括为了推进IPO或者增发、防止被ST,和机构联手进行股价操纵等。第二是由于公司内部控制出现缺漏给管理层提供了舞弊的条件。当管理层实施舞弊受到的处罚很轻,公司内部控制存在缺陷,董事会能够隐瞒交易等情况存在时,就具备了财务造假的条件。前两个诱因都满足的时候,决定舞弊发生与否的要素就只剩管理层的道德标准,如果管理层能够自我说服,就会导致舞弊行为的产生,比如:“为了员工的生存”,“维护中小股东的权益”,“帮助公司度过难关”等。Albrecht的三角理论提出后,Bologan提出了“四因子理论”,此理论将财务舞弊的动机归为贪婪和需要;机会是指公司内控机制的不完善带来的条件以及造假行为被发现面临的处罚。
  二、财务舞弊的识别方法
  上市公司财务舞弊的识别分为二个阶段,第一阶段是案例特征总结,研究者对于上市公司公司财务造假的典型案例进行影响因素分析,研究方法主要是定性研究。Beaver在1966年提出了财务预警的概念,然后Albrecht通过问卷调查的方式检验了87个常用的财务指标,并从中筛选出有效识别公司舞弊的指标,构成了“红旗”指标体系。Persons研究发现舞弊公司普遍具有高财务杠杆,低资本周转率的特点。国外学者认为公司治理的质量与财务舞弊发生可行性有密切的关系,开始将董事会特征、股权结构等非财务指标引入财务舞弊识别体系中。Loebbecke建立了公司财务造假识别模型L/W用以分析财务造假的行为特征,提出董事会个人的不良信用记录、违法记录、业绩下滑、控制权寡头等可以作为识别财务舞弊的信号。在接下来的研究中,Loebbecke和Willingham使用财务舞弊公司样本,用卡方检验的方法对L/W进行测试,研究表明该模型有88%的识别率。Bell随后用该模型测试了包含正常公司和财务造假公司的样本,得到了75%的造假识别率。但是这种模型对财务数据和非财务数据的要求苛刻,只适合于能够接触到非公开信息的监管机构和审计人员使用。
  能够识别财务舞弊的非财务指标包括董事会结构、管理层数量等。研究结论包括:审计意见类型可以作为替代审计质量的有效指标,非标准审计意见与财务造假显性相关,提升管理层薪酬和待遇能降低公司财务造假的概率,管理层的独立性和造假行为呈现显著相关性,独立董事占比低,任期短,独立性差与财务造假呈负面相关关系,公司内部审计不能显著降低公司财务舞弊的可能性等。
  第二阶段是用大数据挖掘技术识别财务舞弊。数据挖掘是指从大量无序的数据中找到潜在的商业逻辑,并将结果用可视化的方式向用户进行展示,它包括了统计学中样本检验的过程,也包含了机器学习和训练的过程。数据挖掘作为信息提取和模式识别的手段,可以选择违规案例中的财务和非财务信息构建样本数据和验证集数据,然后用样本数据建立模型,再用验证集测试精确度。数据挖掘典型方法有以下两类。
  第一是统计类方法,分为单变量分析和多元线性方法。传统的回归技术是用统计模型评估应变量和一个或多个自变量之间的关系,主要研究数据系列的趋势特征及数据间的相关关系。这种方法广泛用于解释市场占有率,消费行为偏好、销售趋势预测以及开展有针对性的促销活动等。运用较多的是Logistic回归模型。相比多元线性,逻辑回归有更好的适应性,但逻辑回归也存在变量的多重共线性问题,特别是在财务舞弊的识别领域,由于财务比率之间的勾稽关系,变量相关性高的时候,模型的泛化能力会受到很大影响。
  第二类是在“互联网+”的背景下的大数据挖掘技术的应用。
  分类是根据数据的共同特点按照模式将数据划分为不同类,这个步骤称为用学习训练集创建模型,分类模型的学习阶段中,每个数据元已经分好类别,有明确的类别标记,通过学习得到目标函数, 再利用分类器将其它给定的具有相似特征的数据项映射到预先定义的类别標记中,用以预测数据对象的离散类别,这种学习过程是属于监督式的学习。分类技术广泛地应用在多个领域,比如非财务信息:客户分类,属性和特征分析,满意度分析,购买偏好,趋势预测等。主要的分类方法有决策树、KNN、朴素贝叶斯、支持向量机、随机森林等。在实证研究方面,赵秀云选取了具有财务舞弊特征的18个财务和非财务指标,用决策树构建模型预测发生舞弊的可能性。这些研究多为单因素识别模型,除了传统的回归模型外,随着数据挖掘技术的发展,结合机器学习以及经典算法的应用,可以使用神经网络、聚类等更先进的数据挖掘技术构建财务舞弊模型。   分类算法的缺陷在于在大数据环境下,数据源多种多样,类别个数和种类无法确定,预处理的过程复杂且代价高昂,聚类提供了相应的解决思路。聚类研究的是在没有训练样本的情况下划分样本,目的是在目标数据库类别未知的情况下分类使得变量在同一聚类之间最小化,不同聚类之间最大化。聚类和分类不同的地方在于分类的类别标记是明确的,学习的类别个数已知,而聚类没有预先定义的类别标记,需要由学习算法自动确认。由于聚类没有明确的定义, 因此存在多种聚类算法和模型,不确定性导致效果难以评估,不重视训练集,通常不涉及预测。常用的聚类算法有K-means均值聚类、DBSCAN、Canopy等。聚类的应用范围包括客户背景分析、市场精分、定义客户信用程度等。
  1958年,Rosenblatt提出了双层神经元组成的单层神经网路“感知器”,“感知器”拥有一个计算层负责输出结果,通过训练得到权值,是首个可以学习的人工神经网络。但是它无法解决异或问题,只能做简单的线性分类任务。“感知器”增加一个计算层变成两层神经网络后,Rumelhar和Hinton于1986年提出的BP算法解决了两层神经网路的复杂计算问题,通过隐藏层对原始数据进行空间变换,使数据从线性不可分变成线性可分,不仅解决异或问题,而且对于非线性可分数据的预测有很高的精确度。
  神经网络的构建首先是选择公司舞弊样本,选择上海和深圳证券交易所以及财政部处罚的违规的公司为样本,其他的筛选条件包括报表类型为年度报告,对比公司选择同行业里资产规模相同,同年份,没有受过监管机构处罚,并剔除被ST过的A股上市公司,剔除金融行业公司。选用的指标分为财务指标和非财务指标,财务指标包括营运能力,偿债能力,风险水平等,非财务指标包括股权结构、治理机制、股权集中度、董事会结构、管理层人员数量等。神经网络的方法对变量之间的多重共线性很敏感,因此对于上述指标进行因子分析简约变量排除多重共线性影响。然后采用不同的神经网络技术构建财务舞弊识别模型,用筛选出来的财务舞弊样本公司作为训练集,对比公司作为测试集进行检验,如果训练结果和测试样本的准确率较高,这个模型就可以作为识别工具。
  Green和Choi于1997年采用随机样本基于神经网路构建了财务舞弊识别模型,随后,国内外学者开始使用不同的挖掘技术进行研究比较。国内研究者张秋三,张磊使用148家上市公司,从盈利能力、偿债能力、成长能力、营运能力、资本结构几个方面筛选出16个财务指标,再结合非财务指标提取的主因子作为输入变量,是否舞弊作为输出变量,用IBM SPSS Modeler构建基于神经网络的财务舞弊识别模型,该模型能够达到70%的正确率。顾宁生选用33个测试样本,其中22个用作训练集,11个用于测试集,用神经网络的识别率能达到86.7%。Kirkos的研究认为应用BP神经网络对于财务报告真假的预测精度能够达到90.3%,高于决策树的73.6%,Alden发现遗传算法相对于Logistic回归模型对财务舞弊有更优异的识别能力,Chi-chen Lin的研究根据129个舞弊样本和447个非舞弊样本比较不同模型识别有效性,认为相比于Logistic模型和决策树,人工神经网络识别效果更优。
  三、未来展望
  将神经网络用于财务舞弊的识别也有不足之处。首先,样本选取的差异性导致模型的实用性得不到保证。研究者无法保证选出的测试样本没有财务舞弊的行为产生,它可能参与财务舞弊,只是还未被发现。另外模型的输入数据都是采用已发布的财务报表上的数据,因此会受到人为因素的影响。其次,不同的研究者对于自变量和因变量的选择逻辑不一,因变量选择0和1衡量公司是否財务造假,无法衡量财务造假的程度。
  近年来,随着文本挖掘方法的兴起,文本挖掘技术也逐渐应用到财务舞弊识别过程中,比如研究财务报表中的表达情绪来区分有舞弊行为的财务报告和真实的财务报告等。随着管理会计信息化体系的完善与推进,未来的大数据挖掘技术将结合文本挖掘,从财务报表、公司公告、自媒体等方面发现更多的财务造假特征。
其他文献
摘要:随着市场需求的不断扩大,信息技术的发展以及竞争理念的日益增强,项目管理能力对项目的成功起着至关重要的作用,企业项目管理能力的提升已经成为企业关注的重点,而PMO成为企业提高项目管理能力的一种新模式。  关键字:项目管理;PMO;项目管理能力  伴随社会发展和科技进步的加快,目前项目管理的应用领域越来越广,已经成为众多企业在当今高度竞争环境中谋求竞争优势的关键手段。各个行业都涌现出了越来越多的
期刊
摘要:生态环境是社会发展的重要组成部分,生态环境的发展离不开林业,营林生产是林业发展的基础,是林业资源不断循环、可持续利用的重要保障,而加强营林生产管理是提高营林生产效益的有效手段和保障。本文从林木良种及育苗、造林质量、市场管理、营林投入及生产管理制度等方面,论述了营林生产管理中存在的问题,并提出了具体的改善办法以促进林业的发展。  关键词:营林生产管理;促进;林业发展  前言:林业是指保护生态环
期刊
摘要:医院关乎到我国的国计民生问题,在当下医疗体制改革发展的大趋势环境下,我国当前医疗卫生机构中占据主要形式的更多是诊所和私立医院,而以公立医院为主要形式的医院,则占据比例不到1/5。这不仅加大了非营利性的公立医院生存压力和竞争压力,也会使国民在医院进行选择时,针对医院的权威性及透明程度无法做出正确判断。而当前医院内控制度是当前医院确保其工作高效运行的主要工作任务之一,内部控制制度在提升医院服务水
期刊
摘要:自进入信息时代以来,互联网技术、信息技术、大数据技术等多种新兴科技逐渐影响着当代人们的生产生活,促使社会步入新媒体时代。在新媒体时代背景下,高新技术为人们的日常生活、学习、工作提供了极大的便利,但同时也向社会其他领域带来严峻挑战,其中就包括企业的市场营销工作。新媒体这一形式的出现与发展,极大地促进企业市场营销,有利于其顺利度过这一转折时期,但目前企业市场营销过程中存在的问题,阻碍着新媒体与市
期刊
摘 要:物流管理是目前应对经济挑战的一个实用工具,它是企业开展各种业务往来和重要活动的混合。一般物流活动是把供应和销售活动统一在一起。企业机构内部的物流活动尝试通过满足时间和地方相应的市场挑战,并且通过供应服务开支和品质让顾客获得满足,同时会考虑消费者的需要和购买能力。物流管理主要是完善供应链能力,属于供应链管理部件,它主要是从源头到目标规划、操控和执行相应资讯、产品和服务的效率输送和存放,充分满
期刊
摘要:在网络经济时代背景下,金融行业的发展速度相对较快。但是,金融管理面临着新的挑战和机遇,金融机构应该做好金融管理信息化建设工作,制定可行的管理体系,并且对管理模式进行优化,使得各项金融活动能够得到有效监测,消除潜在地风险隐患,使得金融管理适应时代发展需求,实现自身的经济发展。本文分析了网络经济对金融管理带来的积极影响,并且,分析了金融管理模式存在的不足,提出了金融管理模式的建设措施。   如今
期刊
摘要:随着经济全球化的发展,我国的经济发展速度也在不断的加快,市场经济体制也愈加的完善。同样,随着市场的完善,企业所面临的市场竞争也愈加激烈。受到竞争压力的影响,企业想要提高自身的市场竞争力,提高自己的经济效益便必须转变企业管理模式。企业经济管理中将目标成本管理运用进去,能够很好的分析控制和降低企业的成本,帮助企业提高其经济效益,给企业长远的发展奠定基础。笔者主要分析了企业经济管理中目标成本管理的
期刊
摘要:随着市场经济体制的建立,人们对企业管理的词论也越来越多,为了促进服务型政府的建设,政府逐步引入企业管理理念。诚然政府和企业分属于两种完全不同性质的组织机构,但他们本质上都是服务型的组织。本文总结了以往政府服务企业的一些做法,分析了当前政府服务企业存在的问题,提出了进一步加强政府服务企业的对策。  关键词:企业服务;服务型政府  引言:企业是社会产品和服务的创造主体,也是地方经济社会发展的主要
期刊
摘要:在经济快速发展背景下,大数据分析是日常工作中的重要内容。在大数据时代背景下,集团财务部门运用其分析功能,能够为高级管理层提供更多变量的实时动态,提高管理效率和质量,使它们成了集团公司的战略核心位置,这对集团财务管理工作受到非常重大的影响,使得集团财务管理载各个方面面临着新的挑战。为了能够满足社会发展需求,实现企业的可持续发展中,熟练掌握和利用大数据下的数据分析平台,优化财务管理工作调整,适应
期刊
国有资产管理风险排查是规范和加强国有资产管理过程中的必要环节。通过风险排查,查找行政事业单位国有资产管理中存在的风险点,分析问题存在的原因,并提出专业化管理建议,是国有资产管理风险排查的根本目的。本文基于行政事业单位国有资产管理风险排查第三方评估中应关注的领域和实施的主要程序进行了分析。  引言  国有资产管理风险排查是通过对行政事业单位国有资产管理全方位的风险点查找、疏导、整改,进一步规范和加强
期刊