论文部分内容阅读
世界上使用人数最多、信息存储最简练、运用最广泛的语言文字,是中国传统文化和世界文化不可或缺的重要部分,所以针对汉字图像的识别研究具有非常重要的实用价值。手写汉字识别在日常的办公自动化、邮件分拣、金融等领域都具有非常很好的前景,手写汉字识别的研究可以使人们的日常生活更便捷。但是由于汉字的类别多,并且结构复杂,存在大量的相似汉字,再加上不同的人有不同的书写风格,在不同的书写环境、书写方式情况下,手写出来的汉字图像从种类和相似度等方面都很复杂,这就使得手写汉字识别在模式识别领域一直是难点同时也是研究热点。近年来,深度学习成为机器学习领域最热门的研究内容,尤其是在图像识别领域取得了非常好的效果。它能将复杂函数用更简洁的方式表达,可以自动获取样本概率分布同时在学习样本特征上具有优势。因此本文将深度学习模型应用到脱机手写汉字识别任务当中,通过使用深度学习中不同的方法和模型,进一步提高手写汉字识别的准确性。本文研究内容主要分以下几个方面:首先从深度信念网络入手,分析了传统手写汉字识别方法的不足,提出了一种基于深度信念网络融合模型对手写汉字识别的方法。该方法首先用修正的二次判别函数分类器识别较为简单的汉字,而较为复杂的汉字图像交给深度信念网络模型来处理,具体的分工过程通过定义可信度来协调两个分类器在识别任务中的分工,从而达到理想的识别效果。然后从卷积神经网络入手,卷积神经网络优于传统的图像分类方法在特征提取方面,所以将卷积神经网络应用在脱机手写汉字识别问题中。分析了卷积在手写汉字处理中的优缺点,针对相似手写汉字分类问题,进一步改进卷积神经网络,充分利用网络中特征提取的优势,二分类器则采用经典的SVM分类器,两者结合更好的对相似手写汉字识别分类。本文实验选用MNIST手写字、中国科学院自动化研究所采集的CASIA-HWDB1.1、北京邮电大学采集的HCL2000数据集。实验表明,本文提出的基于卷积神经网络的手写汉字识别方法能取得较好的识别效果。