银行票据手写数字串识别的预处理与分割

被引量 : 0次 | 上传用户:lftobto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
票据手写数字串识别系统对银行业有非常大的实用价值。对于扫描得到的票据图像,主要处理步骤包括字符识别以及识别前的预处理与分割两大部分,现有识别算法中,单个数字字符的识别正确率高于99%,在这种情况下,提高整个数字串识别率的关键在于数字串图像的前期预处理与分割。本文以某建设银行支票中的手写数字串为背景,主要对预处理和分割过程中的一些核心技术进行研究和改进,并取得了一定的成果。主要研究内容包括:1)对彩色图像进行灰度化处理,针对图像中存在红色印章的情况,提出了适合本文的图像灰度化算法,在保留数字字符信息的情况下去除印章影响,同时对灰度图像进行增强、去噪,为后续工作打好基础。2)去除数字串的外框,主要分为框线检测与字符相交检测两部分。针对框线有些倾斜、弯曲的情况,提出了先进行直线检测,再寻找精确边缘点,最后分段进行直线拟合的方法准确描述框线。在框线与字符相交的处理过程中,提出了基于灰度梯度的交叉点检测算法,并结合字符与框线的相交形状对交叉点进行左右、上下配对,准确描述了相交部分的信息,最后在去框的过程中,对字符与框线相交的部分进行了保留。3)对数字串进行倾斜矫正,由于每个人的书写习惯不同,不少数字串是倾斜的,为了便于切分以及使数字的特征更加集中,需要进行方向上的归一化处理。对于倾斜角的计算,本文首先提出了基于数字笔画梯度方向的方法,该方法对于90%的数字串有效,对于另外的10%情况,本文又提出了基于字符框架信息的方法计算倾斜角。两种方法相辅相成,取得了很好的效果。4)切割整个数字串为单个数字字符,首先根据每个连通域的字符轮廓信息判别此连通域为单字或粘连字串,对于粘连数字串,提出了一种基于灰度图像的切分算法。算法首先根据灰度图像中,字符边缘点的梯度方向变化率准确寻找切分点,再结合切分线的类别连接切分点,计算切分可靠性,然后选择不同的切分线,生成切割组合,最后基于识别反馈的方法选择最佳切割组合。结合改进的k-近邻分类器,实现了票据手写数字串识别系统,测试1000张数字串图像(每串12个数字),识别正确率为90.2%。
其他文献
开放性的移动设备平台Android近年来发展迅速,使用该平台的智能手机大量面市,获得了市场的广泛好评,因此基于Android平台的应用程序开发已经发展成为一个热门的计算机软件研
造价控制作为基建项目三大控制目标之一,直接影响到基建项目的投资效果。但在现阶段,高校基建项目造价管理还存在着许多问题,项目决策不准确、设计粗糙、施工招标控制不到位
化工储罐火灾影响因素众多,过程所涉及的危险因素、事故机理复杂,火灾现场破坏严重,往往给火灾现场勘查和起火点认定带来很大困难。在目前我国火灾事故调查证据单薄,说服力不
基于壳聚糖(chitosan, CS)与环糊精(cyclodextrin, CD)这两种生物材料的纳米(nanoparticle, NP)给药系统的研究,包括物理混合环糊精/壳聚糖及其衍生物(β-CD/CS)与环糊精固载
目的建立测定麻黄中麻黄碱和伪麻黄碱含量的毛细管区带电泳(CZE)法。方法以200 mmol.L-1硼砂-500 mmol.L-1硼酸溶液(1∶1,v/v)含2 mg.mL-1庚烷磺酸钠和0.4%(v/v)乙腈为背景电解质(BG
随着信息化时代的到来和三网融合的快速推进,车载以太网技术逐渐成为车载通信领域的关键技术,车辆应用需求迫切,市场发展前景广阔。本文结合实际工作情况,概述车载总线技术的
一个文明的发展,不仅仅体现在物质层面的更新,更在于文化层面的繁荣。而文化繁荣的一个必要条件就是公众能够获得充分的文化熏陶,使公众在整个供给体系中能够自由选择合适自
社会生活的信息化和经济的全球化,使英语的重要性不断凸显。英语已经是我国各阶段教育教学的重中之重。英语教育的低龄化使学前英语教育逐渐成为教育界的一个热点话题,成为人
在炭素生产过程中,石墨材料是生产铝用阴极、阳极、电极糊和炼钢用增碳剂等产品的优质原料。添加石墨材料能提高产品自身、原铝及碳钢质量,减少原料消耗,降低生产能耗等,但目
改革开放以来,伴随着住房改革制度的进程,城镇居民的住房问题得到了很大的改善,人均住房面积也逐年递增。但是进入21世纪之后,房地产市场出现了越来越多的投机行为,商品房也