浅议数据挖掘在辅助审计中的应用

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:templedb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:概括介绍了数据挖掘的内涵,阐述了在计算机辅助审计中数据挖掘技术的应用, 且给出了在计算机辅助审计中数据挖掘技术的步骤。
  关键词:计算机辅助审计 数据挖掘 聚类分析
  中圖分类号:TD327.3 文献标识码:A 文章编号:1009-914X(2013)29-259-01
  计算机辅助审计技术大大地提高完成审计任务的效率。随着数据库管理系统和先进快速的数据采集技术的广泛应用, 被审单位的数据积累量也迅速增长。被审单位提供的大量数据中涵盖着极其丰富的信息。依靠传统的数据检索查询机制和统计分析方法来对被审计单位经济活动产生的电子数据来分析被审单位的经济活动情况是非常困难的。
  数据挖掘等面向分析决策的计算机技术应运而生, 而且发展很快。在审计系统中采用数据挖掘技术可为现代化审计提供新的思路和方法, 可以大大地提高审计质量。
  一、数据挖掘概述
  数据挖掘指的是从大型数据库或大量的数据中提取出新的人们感兴趣的、隐含的、先前未知的、对决策有潜在价值的知识的一种技术。在人工智能领域, 这种知识发现被归为归纳学习的一种。
  数据挖掘综合了各个学科技术, 有很多的功能,主要功能有以下几点:1、关联分析。关联分析是从数据库中发现知识的一类重要方法。若两个或多个数据项的取值之间重复出现而且概率很高时, 就存在某种关联, 可以建立起这些关联项的关联规则。2、聚类。识别出分析对象内在的规则, 按照这些规则把对象分成若干类。3、时序模式。通过时间序列搜索出重复发生概率较高的模式,强调时间序列的影响。4、分类。按照分析对象的属性、特征, 建立不同的组类来描述事物。5、偏差检测。对分析对象的少数的、极端的特例的描述, 揭示内在的原因。6、预测。把握分析对象发展规律, 对未来的趋势做出预见。
  需要注意的是, 数据挖掘的各项功能并不是独立存在的, 而是在数据挖掘中互相联系, 发挥作用。
  二、数据挖掘在审计中的应用
  针对审计系统中数据的特点, 包括数据的存储量、数据结构等特点, 可以从众多数据挖掘方法中选择2 种方法在计算机辅助审计系统中进行应用。
  (一) 聚类分析方法
  聚类分析是数值分析学的一个分支, 它将多元理论的分析用于分类。所谓聚类, 简单地说就是从数据集中找出相似的数据并组成不同的簇, 同一簇中的对象尽可能相似, 而不同的对象尽可能相异。通过聚类, 我们能够容易地识别密集的和稀疏的区域, 发现全局的分布模式和数据属性之间的相互关系。聚类分析能作为一个独立的工作, 获得数据分布的情况, 观察每个簇的特点, 集中对特定的某些簇作出进一步的分析。在我们常用的审计分析方法中, 一般都会检查数据的偏差、异常、极端值。因此, 利用聚类分析方法, 我们可以通过与往年审计数据的比较, 分析出被审单位数据的真实性及准确性。
  (二)神经网络方法
  神经网络基于神经元特性的互联模型, 具有并行分布处理数据和自适应、自学习的功能。神经网络具有高度的并行结构和并行处理能力, 因而具有较快的总体数据分析处理能力, 特别适合于审计系统。被审的各个单位彼此之间有较多的联系, 因此, 在审计过程中, 计算机处理审计数据需要具备较强的并行处理能力。同时, 神经网络是通过研究系统过去的数据记录进行训练, 找出输入与输出之间的内在联系。一个经过适当训练的神经网络具有归纳全部数据的能力。因此, 利用神经网络方法, 我们可以选择神经网络中的具体算法, 对被审单位的数据进行适当训练, 归纳出全部数据。通过分析数据, 可以检查出被审单位是否存在一些舞弊、违背规律和规定的行为。
  三、数据挖掘技术在计算机辅助审计中的步骤
  数据挖掘技术在计算机辅助审计中一般操作分为5个步骤。
  (一)确定业务对象与审计目标
  在开始知识发现之前, 最先的同时也是最重要的要求就是了解数据和审计业务问题。缺少背景知识, 就没法明确要分析的问题, 不能为挖掘准备数据, 也很难正确地解释挖掘得到的结果。
  (二)数据的采集
  在建立模型前, 首先要导出被审单位财务管理数据。然后将数据导出后存入审计人员的电脑中, 置于审计人员自己定义的某一目录下。最后, 需要综合数据词典和数据库说明等技术文档对数据的含义, 对审计业务、审计业务流程的理解等方面的认知情况, 对数据产生全面深入的认识。分析数据是找到与要分析的主题相关的数据表和数据字段, 预测对分析结果影响较大的数据。在分析的基础上, 为建立模型选择变量、选择记录, 并将数据进行适当的变换, 使之成为适合于数据挖掘的形式。数据变换可能涉及数据标准化, 即将属性数据按比例缩放, 使之落入一个小的特定区间。
  (三)数据的整理及准备
  由于数据可能是不完全的、有噪声的、随机的, 有复杂的数据结构,所以要对数据进行初步的整理, 清洗不完全的数据, 做初步的描述分析,选择与数据挖掘有关的变量, 或者转换变量。
  (四)建立模型
  建立模型是一个反复的过程, 需要根据分析主题和数据情况来考虑用哪一种孤立点分析方法对要解决的问题最有效, 有时需要根据实际情况, 在已有的挖掘算法基础上, 结合各类算法的优点, 形成新的改进算法。而且, 在数据挖掘过程, 并不是写好算法后剩下的一切就可以自动完成。任何一个模型都需要人员的参与, 不仅是设计人员, 同时也要包括经验丰富的审计人员。对建立好的模型要进行试用, 由对被审单位业务熟悉的审计人员对挖掘结果进行评价。
  (五)评价和解释结果
  挖掘工具常提供可视化的工具展现挖掘结果,最后要对该结果进行分析、评价,并合理解释挖掘的结果。结果不理想时,可以寻求别的算法,或调整挖掘算法的有关参数。挖掘结果为审计人员提供问题的线索,审计人员仍需根据线索进一步追踪检查相关资料, 落实问题。
  四、结论
  数据挖掘是从大量的数据中提取隐含在数据中的、先前未知的、并有潜在价值的知识的过程。数据挖掘的许多知识对于审计工作来说未必全部都是有用的,然而数据挖掘主要用于发现一些异常的数据和行为, 这些信息通常是审计工作中需要特别注意的重点。对于一般被审单位, 我们都可以使用具体的数据挖掘技术来检查一些舞弊、违背规律和规定的行为,以达到利用数据挖掘完成审计工作的功能,大大降低了审计风险。
  参考文献:
  [1]朱艺华.面向计算机审计的移动数据挖掘服务研究[J] .计算机系统应用, 2006, 12(3) :39- 42.
  [2] 陈文伟.数据仓库与数据挖掘教程[M] .北京: 清华大学出版社,2006
  [3] 孙吉贵,刘杰,赵连宇. 聚类算法研究[J]. 软件学报,2008,19(1):48-61.
其他文献
摘要:随着世界经济一体化的发展,我国煤矿生产正走着一条高投入、高耗能、低产出、低回报的粗放型的经济增长道路,安全问题突出,矿山机电管理也成为企业管理的一项重要内容。本文着重分析了煤矿企业在机电管理工作中存在的问题,并提出加强煤矿机电管理工作的相应措施。  关键词:煤矿 机电管理 存在问题  中图分类号:TD353.5 文献标识码:A 文章编号:1009-914X(2013)29-549-01  一
期刊
摘要:深孔钻探采用绳索取芯技术能大大提高钻进效率和钻孔质量,并达到了优质孔的目标,取得了良好的经济和社会效益。本文从钻孔取芯技术措施、绳索取心钻具的结构原理、钻头的选择和使用和钻孔防斜措施四个方面进行了分析。  关键词:绳索取芯 技术 深孔钻探  中图分类号:TD 文献标识码:A 文章编号:1009-914X(2013)29-567-01  一、钻孔取芯技术措施  (1)当打捞器接近内管总成时,要
期刊
摘要:本文针对联合站泵类设备选型存在的不合理现象,对双螺杆泵的选型条件进行了简单介绍。根据坨六联合站外输原油的介质特性,详细介绍了2WW型双螺杆泵的选型过程及其特点。通过合理选用2WW型双螺杆泵,坨六联合站外输原油生产运行平稳,与JS型离心泵相比2WW型双螺杆泵更容易维护,节能效果明显。  关键词:泵站 双螺杆泵 输送介质 节能  中图分类号:TU831;TU201.5 文献标识码:A 文章编号:
期刊
摘要:本文简要介绍了当前主要用于水土保持工程中草被植物的类型,并在此基础上从降雨截留、消弱侵蚀、改善土壤物理性状、提高肥力、降低水分蒸发、提升土壤含水量以及降低旱涝发生的频次与危害程度等方面分析了草被植物在水土保持工程中的作用。  关键词:水土保持 草被植物 应用  中图分类号:F203 文献标识码:A 文章编号:1009-914X(2013)29-584-01  受人类过度开发自然资源引发全球气
期刊
摘要:水平井挖潜技术是油气田开发、提高采收率的一项重要新型技术。新木油田针对影响油田开发的复杂条件下探明难采储量不断开展水平井技术研究应用,本文从油藏开发管理角度出发,就水平井地质、浅层水平井钻井、定向射孔、压裂技术、增产挖潜和效果评价等方面进行水平井配套技术研究与探讨,从2006年至今水平井已被广泛应用于新木油田难采低渗透储层整体开发,受限井区储量开采,新区产能建设、老油田剩余油挖潜当中,实现了
期刊
摘要:油井自动化监控系统是采油厂生产自动化建设的重要组成部分,自该系统在采油厂投入使用以来,取得了良好的应用效果。本文总结了两年来的维护中系统中存在的各类电源问题,并通过理论分析,提出了解决方案。  关键词:油井监控  中图分类号:TD353.5 文献标识码:A 文章编号:1009-914X(2013)29-578-01  1概述  油井自动化监控系统是采油厂生产自动化建设的重要组成部分,该系统在
期刊
摘要:文章首先分析了南桐矿业公司所属各矿,井下采煤工作面机巷运输设备存在的问题,介绍了650型胶带输送机的研制过程、功能、主要技术指标及工作原理,总结了该设备在矿井的应用情况及其效果分析。  关键词:皮带 输送机 研制 应用  中图分类号:TG333.7 文献标识码:A 文章编号:1009-914X(2013)29-580-01  目前,重庆市能源投资集团有限公司南桐矿业公司所属各矿,采煤工作面机
期刊
摘要:本文分析了计划生育药具的基本原则,并阐述了当前计划生育药具工作存在的问题,并就如何进行计划生育药具的实施策略。  关键词:计划生育药具 基本原则 问题 实施策略  中图分类号:F426.31 文献标识码:A 文章编号:1009-914X(2013)29-294-01  1、计划生育药具的基本原则  1、坚持综合决策原则。进一步加强药具免费供应主渠道模式,深化药具工作管理体制和机制改革,将其纳
期刊
摘要:本文从目前我国安全生产的现状出发,阐述了安全心理学在企业生产安全管理中的作用,总结了如何应用安全心理学来控制人的不安全行为,分析了人的不安全行为与事故发生的关系,提出了如何控制人的不安全行为和遏制事故发生的方法,对提高企业安全生产管理水平具有重要的指导意义。  关键字:安全心理学 安全管理 安全生产 不安全行为  中图分类号:X911 文献标识码:A 文章编号:1009-914X(2013)
期刊
摘要:在卫生体制改革的新形势下,加强医院思想政治工作,树立医院的经营理念、行为准则、经营理论和宗旨,是医院发展中不可或缺的重要组成部分。医院如何强化思想政治政治工作,整体提升医务人员的综合素质和医院科学管理水平,发挥医院无形资产的巨大作用,为医院创造巨大的社会效益和经济效益,是医院党务工作者必须思考和重视的问题。同时,强化医院思想政治工作,既是现代化医院经营管理模式的一部分,也是医务人员精神文明建
期刊