论文部分内容阅读
手写字符的识别研究时冷时热,在过去几十年里,人们提出了许多识别方法和识别技术,但由于识别的关键技术没有解决,再加上产品定位等方面的原因,使得已有的识别系统远不能达到实际应用的要求,这其中有理论研究和技术实现等多方面因素。手写体数字识别是字符识别的一个分支,问题虽然简单,但却有较大的使用价值。目前我国在信函通信时广泛使用了邮政编码,用手写体数字识别技术进行信函的自动分拣对减轻邮电职工的手工分拣工作有很大得意义。手写数字虽然只有10个种类,但很多情况下,对识别的精度要求非常高,而且手写数字的变动性非常大,在这种情况下,要真正做到高精度的识别就不是那么容易。
本论文首先阐述计算机字符识别技术的必要性,论述手写数字识别的意义;接着简单阐述了手写数字识别的典型应用,对其在大规模数据统计、财务、税务、金融及邮件分拣中的应用进行了探索;继而讨论了手写数字识别的预处理技术,包括二值化、行字切分、平滑、去噪声、规范化和细化等。二值化时对整体阈值二值化、局部阈值二值化、动态阈值二值化和利用空间信息进行阈值选取几种常用的阈值选取方法进行讨论,特别对利用空间信息进行阈值选取进行了详细论述;在对通过对基于数学形态学的细化的基础上,讨论序贯同伦形态细化算法和保形的快速形态细化算法;最后在对手写数字的分割的基础下对脱机手写数字识别进行了研究,对基于最小距离分类器字符识别、基于树分类器的字符识别、基于自适应共振(ART)网络的字符识别分别进行了详细讨论,并引入置信度分析将多个分类器进行了混合集成。
本论文对手写数字识别的原理、方法进行了深入的研究,提出的识别技术精度较高,可以达到实际应用的要求。本论文成果对于信息的自动化、国民经济信息网络的推广具有重要意义,对于手写汉字识别的研究具有很高的参考价值。