论文部分内容阅读
手写数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。由于阿拉伯数字的世界通用性,并且数字的识别和处理也常常是一些自动化系统的核心和关键,所以对手写体数字识别的研究通用性强,且意义重大。在对多种手写字符识别的相关技术进行调查和研究后,本文提出了一个基于多级神经网络集成的手写数字识别仿真系统,面向脱机手写体孤立数字的识别。整个系统由四个模块构成:首先以图像预处理模块和字符特征提取模块作为模式数据输入的基础;其次采用多个BP神经网络作为识别的核心分类器,即分类模块;然后对这些神经分类器的输出结果进行融合判决来获得最终识别结果,即决策模块。本文的主要研究工作集中在特征提取和多分类器融合识别上。在特征提取方面,在对多种有发展潜力的特征提取方法进行实验分析的基础上,提出了一种全局特征和两种局部特征作为主特征,并组合一系列低维辅助特征的组合方法。实验证明这三组组合的特征向量对手写数字均具有高分类能力。在多分类器融合方面,将本文提出的融合方法与对其它多种融合方法进行了实验分析和对比。实验表明,利用多分类器融合策略均可以达到高精度识别,并且本文提出的融合方法略优于其它融合方法。本文第一章介绍了手写体数字识别的应用前景、研究现状以及研究方法,并介绍了模式识别的常用方法,说明了手写体数字识别的难点和其广阔的应用前景。第二章介绍了手写体数字识别中的预处理技术,包括图像的平滑、二值化、图像规范化,细化等技术,同时介绍了本文提出的细化后处理算法。第三章介绍了特征提取技术,以及本文的识别系统中使用的特征提取算法,并通过实验分析选择了最佳特征组合方案。第四章介绍了神经网络的原理和算法,并指出神经网络用于手写数字识别的内在机理和独特优势。最后,通过本文提出的数字识别仿真系统对MNIST手写数字图像库分别进行了三种单分类器识别实验和多级分类器的若干融合方法实验。实验表明单分类器最好识别率为98.14%,而多分类器融合方法的识别性能均高于单分类器系统,最高识别率达到了98.47%。最后,加入4%左右的据识策略时,得到99.60%的识别精度,错误率仅为0.38%,具备实用价值。