论文部分内容阅读
金融票据的自动识别是模式识别的重要应用领域。几乎涉及了模式识别与图像处理的所有重要分支,是一个综合的研究课题,具有理论和实用两方面的价值。本文从实际工作出发,总结了作者在银行票据自动处理系统中,票据的版面分析及其数字域的识别这两个方面所做的一些工作,研究了目前在这个领域上的一些先进方法和思想,同时提出了一个完整的票据版面分析系统以及对现行系统的一些改进思路,为进一步的工作打下基础。 在提出一个完整的票据版面分析系统的基础上,作者对票据的版面分析流程中的每一个模块做了详细的讨论,并且给出了具体的方案。在版面学习阶段,主要包括预处理和票据表格信息提取两个部分。接下来,就是票据版面的类型识别阶段,本文给出了两种方法。在票据填写域(变域)的版面分析阶段,主要包括无损脱框和字符串的分割两个方面。本文只讨论变域为数字域的情况。其实,这个阶段也就是手写数字识别的前处理阶段,为手写数字的识别做一些准备工作。 手写数字识别是本文的一个重要内容。在给出基本概念以后,作者探讨了目前系统中所使用的手写数字识别方法——基于拓扑结构的方法,并给出了实现这个方法的具体措施以及实验的部分结果。同时,还研究了基于轮廓分段特征的手写数字识别方法,并将其与基于拓扑结构的方法从特征提取的特征不同,特征存储与表示的不同、判决分类的方法不同以及对待拒识结果的处理不同等各个方面都进行了比较。目前在手写数字识别方面有许多研究成果,如近年来多分类器和神经网络在这方面的应用得到了普遍重视,作者最后探讨了在现行识别方法的基础上,从互补优势的思想出发,吸收多分类器和神经网络技术的思想,提出了一个关于现行识别方法的改进原型。 总之,本文的贡献在于提出了一个完整的票据版面分析系统的原型,并对其中的每一个模块做了详细的讨论;探讨了目前系统所使用的基于拓扑结构的手写数字识别方法,并给出了实现这个方法的具体措施以及我们实验的部分结果;最后,根据目前所存在的问题,提出一个关于现行识别方法的改进原型。