论文部分内容阅读
                            
                            
                                在信息化飞速发展的今天,光学字符识别技术一直扮演着重要的角色。手写字符识别作为光学字符识别领域中的一个重要分支,有着广泛的现实应用(如:邮件自动分拣、统计报表录入、银行票据识别等)。此外,该领域的研究成果也能够推广到诸如汉字识别、人脸识别等其他模式识别领域。因此,对于手写体字符识别的研究既具有现实应用意义,同时也具有理论学术意义。特征提取和分类器设计是光学字符识别中的两个关键技术环节。在特征提取方法中,主成分分析是一种被广泛采用的方法。但该方法存在运算时间长、识别率较低、工程实际应用困难等问题。在分类器设计环节,神经网络凭借其出色的分类性能而被广泛采用。在神经网络训练算法中,BP算法是一种被广泛采用的算法。但BP算法是基于梯度下降理论设计的,该算法存在着诸如容易陷入局部极小、隐层神经元个数选择缺乏理论依据、训练时间长等诸多问题。近年来,在人脸识别领域提出了二维主成分分析的特征提取方法,较之传统主成分分析方法具有更高的识别率和更短的特征提取时间。本文在此基础上,改进了主成分分析中的特征生成矩阵,使用了新的样本像素分类方法,提高了系统的识别率。在神经网络分类器训练环节,使用了代数算法来训练网络,取得了出色的训练和识别效果,改善了BP算法在识别率、训练速度、训练精度等方面所存在的问题。具体来说,本文主要做了以下几项工作:1.将近年来在人脸识别领域提出的二维主成分分析算法应用于手写数字识别问题,并与经典主成分分析算法进行了对比实验。实验结果显示,二维主成分分析算法在特征提取时间以及识别率上都要优于经典的主成分分析算法。2.在二维主成分分析算法的基础上,在计算特征生成矩阵阶段提出了新的样本图像像素分组策略NetPCA。该方法综合了统计特征和结构特征两种特征提取方法。在样本测试阶段,使用该策略提取的特征的最佳识别率要优于二维主成分分析。3.使用代数算法这一新的神经网络学习算法来训练神经网络分类器。该算法将复杂的非线性优化问题转化为了简单的代数方程组求解问题,并实现了代价函数为0的精确映射。解决了传统BP算法容易陷入局部极小、训练时间长、网络结构参数确定缺乏理论依据等缺陷。4.实现了基于主成分分析特征提取、神经网络分类器的手写数字识别系统。并通过了对美国国家邮政局USPS字库中全部字符完整的识别实验,证实了上述算法的有效性和准确性。