论文部分内容阅读
注册会计师为企业提供审计服务,是企业发展的重要参与者。有效识别审计风险,能帮助注册会计师合理规划审计工作,发表正确的审计意见。信息化时代背景下,企业生产和经营会产生大量信息,如何在这些信息中识别审计风险是审计人员面临的一大难题。部分企业基于自身利益对财务报表进行粉饰,进一步提高了注册会计师识别审计风险的难度。而传统审计风险识别方法存在成本高、泛化能力差的不足,无法满足审计人员的工作需要。在此背景下,本文利用数据挖掘方法,构建了审计风险识别模型,帮助注册会计师在审计程序制定前进行审计风险识别,提高审计工作效率和工作质量。本文主要工作如下:
首先,回顾和参考已有的国内外学者关于审计风险的研究文献,梳理审计风险识别和数据挖掘方法的相关理论。然后,在现有文献研究的基础上,引入会计信息披露及时性和上市公司信息披露考评两项非财务指标,构建了涵盖28项财务指标和7项非财务指标的审计风险识别指标体系。其次,以2010—2019年124家A股上市公司数据作为研究样本,依据是否被证监会等相关机构处罚划分高审计风险和低审计风险水平.并对样本数据进行主成分分析,将35项指标降维,得到13个主成分指标,减少了模型学习时间和模型学习复杂度,提高识别效率。随后,利用BP神经网络、支持向量机和随机森林数据挖掘算法建立审计风险分类识别模型,采用混淆矩阵评价模型性能,发现支持向量机识别模型的识别效果性能最佳,对于样本数据集有91.12%的正确率。最后,运用D-S证据理论进行数据融合,把三种分类识别模型输出结果进行融合,使模型的识别正确率提高到92.47%,有效解决三种分类器输出结果不同时如何选择的问题,帮助注册会计师有效识别审计风险,具有实际应用价值。
首先,回顾和参考已有的国内外学者关于审计风险的研究文献,梳理审计风险识别和数据挖掘方法的相关理论。然后,在现有文献研究的基础上,引入会计信息披露及时性和上市公司信息披露考评两项非财务指标,构建了涵盖28项财务指标和7项非财务指标的审计风险识别指标体系。其次,以2010—2019年124家A股上市公司数据作为研究样本,依据是否被证监会等相关机构处罚划分高审计风险和低审计风险水平.并对样本数据进行主成分分析,将35项指标降维,得到13个主成分指标,减少了模型学习时间和模型学习复杂度,提高识别效率。随后,利用BP神经网络、支持向量机和随机森林数据挖掘算法建立审计风险分类识别模型,采用混淆矩阵评价模型性能,发现支持向量机识别模型的识别效果性能最佳,对于样本数据集有91.12%的正确率。最后,运用D-S证据理论进行数据融合,把三种分类识别模型输出结果进行融合,使模型的识别正确率提高到92.47%,有效解决三种分类器输出结果不同时如何选择的问题,帮助注册会计师有效识别审计风险,具有实际应用价值。