论文部分内容阅读
票据手写数字串识别系统对银行业有非常大的实用价值。对于扫描得到的票据图像,主要处理步骤包括字符识别以及识别前的预处理与分割两大部分,现有识别算法中,单个数字字符的识别正确率高于99%,在这种情况下,提高整个数字串识别率的关键在于数字串图像的前期预处理与分割。本文以某建设银行支票中的手写数字串为背景,主要对预处理和分割过程中的一些核心技术进行研究和改进,并取得了一定的成果。主要研究内容包括:1)对彩色图像进行灰度化处理,针对图像中存在红色印章的情况,提出了适合本文的图像灰度化算法,在保留数字字符信息的情况下去除印章影响,同时对灰度图像进行增强、去噪,为后续工作打好基础。2)去除数字串的外框,主要分为框线检测与字符相交检测两部分。针对框线有些倾斜、弯曲的情况,提出了先进行直线检测,再寻找精确边缘点,最后分段进行直线拟合的方法准确描述框线。在框线与字符相交的处理过程中,提出了基于灰度梯度的交叉点检测算法,并结合字符与框线的相交形状对交叉点进行左右、上下配对,准确描述了相交部分的信息,最后在去框的过程中,对字符与框线相交的部分进行了保留。3)对数字串进行倾斜矫正,由于每个人的书写习惯不同,不少数字串是倾斜的,为了便于切分以及使数字的特征更加集中,需要进行方向上的归一化处理。对于倾斜角的计算,本文首先提出了基于数字笔画梯度方向的方法,该方法对于90%的数字串有效,对于另外的10%情况,本文又提出了基于字符框架信息的方法计算倾斜角。两种方法相辅相成,取得了很好的效果。4)切割整个数字串为单个数字字符,首先根据每个连通域的字符轮廓信息判别此连通域为单字或粘连字串,对于粘连数字串,提出了一种基于灰度图像的切分算法。算法首先根据灰度图像中,字符边缘点的梯度方向变化率准确寻找切分点,再结合切分线的类别连接切分点,计算切分可靠性,然后选择不同的切分线,生成切割组合,最后基于识别反馈的方法选择最佳切割组合。结合改进的k-近邻分类器,实现了票据手写数字串识别系统,测试1000张数字串图像(每串12个数字),识别正确率为90.2%。