论文部分内容阅读
手写数字识别广泛应用于涉及文档、票据、信件处理等应用中,是近年来的热点研究课题。手写数字识别的核心问题是提高手写数字识别的准确率。但是手写体的数字由于其人为因素的差异,使得其特征变化多样,具有很大的随意性,识别困难。本文是针对调查问卷自动识别统计系统的研发课题的子课题,对脱机手写数字图像识别问题展开研究,以期达到高准确率和快速的脱机手写数字识别的目的。本文系统地探讨了手写体数字识别的主要环节,包括图像的预处理、特征提取和分类器构造问题。为了实现准确的字符切分,提出了一种快速连通域快速标记算法,并在此基础之上实现了一种基于结构分析和逐步搜索的数字串切分方法。在对切分后的图像进行归一化处理时,提出了一种能够很好地保持二值图结构连通性的图像缩小算法,有效地避免了图像缩小后造成过多的特征缺失。在特征提取阶段,通过对一些常用的特征向量的组合实验,得到了一组较优秀的特征组合策略,并根据数字字符的结构原理,提出了一种更为精细的凹性特征分类方法,并以此为基础,设计了一种三级混合神经网络分类器结构。该分类器通过凹凸性特征进行粗分类,并对粗分类的结果再进行第二级分类和第三级分类,从而有效地提高了字符的识别率。通过对算法的实验和分析表明,本文提出的快速连通域标记算法原理及实现简单,且速度快于目前现有的算法。二值图像缩小算法能够更好地保持图像的连通性,尤其是在处理连通性强并由线条构成的图像时具有良好的特性,既可应用于数字字符图像的归一化,也可应用于地形图、区域图等的缩放等应用中,且具有较快的速度。本文提出的多级混合神经网络分类器能够有效地降低手写数字识别的错误率,对USPS样本的识别可达到99%以上的正确率。