论文部分内容阅读
[摘 要]电网企业目前的计算机审计工作主要基于数据库中的电子数据进行分析,而从审计经验看,被审计单位的各类纸质文件中往往隐藏着大量的审计线索和疑点,如何充分利用相关数据是本课题的核心。基于此,本文首先要解决的问题就把相关纸质文件转化成计算机能够识别的文字,这需要企业利用扫描仪将相关文件扫描成图片;其次,本文研究了OCR图片识别技术,将扫描后的图片文件进行OCR处理,并抽取成文字文档,为相关文档的深度挖掘和利用奠定基础。
[关键词]OCR技术;审计文本识别;现场审计
doi:10.3969/j.issn.1673 - 0194.2020.16.036
[中图分类号]F239.1 [文献标识码]A [文章编号]1673-0194(2020)16-00-03
0
[关键词]OCR技术;审计文本识别;现场审计
doi:10.3969/j.issn.1673 - 0194.2020.16.036
[中图分类号]F239.1 [文献标识码]A [文章编号]1673-0194(2020)16-00-03
0