论文部分内容阅读
在金融领域中,许多需要处理大量字符信息录入的场合,在很大程度上要依赖数据信息的输入。发票上的号码是发票印刷数量的标识,每张没有重复,因此可以用来标识发票的身份,如果能通过计算机图像处理技术开发一种智能发票数字识别系统,自动识别发票上的号码,就可以有效地实现对发票的管理,具有广泛的应用价值。本文除了对发票号码进行识别外还对发票的面值进行识别,完成了一套发票号码识别系统的设计与研制,包括图像分割、定位、识别算法,用VC++6.O编写了发票数字识别程序,建立了可运行的发票号码识别系统。 首先通过对比CCD与CIS摄像头的特性,主要考虑时间因素选取了一款佳能牌CCD摄像头作为图像获取装置硬件。采集到的号码图像存在多种噪声,通过均值滤波和中值滤波等去噪声算法的对比和实验,选取了高斯滤波的方法去除噪声。 对当前流行的图像分割方法并行、串行边界技术和区域技术进行比较和实验,在分割效果、时间和算法复杂度上均难以满足本识别系统的要求。本文针对发票号码图像中的号码信息为红色线这一重要因素,对图像做了保留红色分量处理,然后对发票图像进行自动阈值分割及二值化等操作,再用数学形态学闭运算进行处理。 利用计算孤立单元面积法去除污迹噪声的干扰,进行断线的连接。水平方向采用投影的方法进行定位,垂直方向采用改进的基于穿越号码体距离的方法进行垂直定位,避免了双峰或多峰的干扰,定位号码准确。 本文对现有识别方法进行了研究,提出了基于穿越号码次数的结构识别方法,对发票上的号码信息进行识别,此方法处理速度快,识别发票号码准确率高。最后介绍了应用模板匹配法对发票的面值的识别方法。 通过对100幅发票号码图像实验表明,识别率达98%。