论文部分内容阅读
随着知识文化的创新和科学技术的发展,人们对日常生活质量标准的要求有所提高,对电子产品功能的要求越来越多,对手写汉字提出了新的要求,手写汉字识别在处理文件、邮件的分类、商业等社会活动中都有着巨大的潜力。但汉字总量大、结构复杂、形近字多以及书写风格多变,导致汉字识别技术难度加大,现有的解决方案很难达到人们所要求的水平。目前看来,随着机器学习逐渐被研究者们所熟知,深度学习的探索之路也随之展开并在短暂的实践内成为机械学系中最受欢迎的研究内容。深度学习通过把复杂函数简单地显示出来,还能够自动获得样本概率分布,在学习样本特征中显现出超乎寻常的优势,研究者们主要把它广泛的应用于图像识别领域。因此本研究以卷积神经网络、LeNet-5结构模型和TransFlow框架等技术为基础,采用中国科学院自动化研究所采集的CASIA-HWDB1.1手写汉字数据集,通过Python编程软件加以实现。本研究前两章主要阐述研究的背景、目的和意义,然后通过文献研究法梳理国内外基于深度学习的手写汉字识别技术的研究现状,并对研究的难点问题进行分析。汉字识别技术分为两个部分,前一部分是联机手写汉字识别,计算机通过获取输入汉字已知的笔画顺序、笔画方向和汉字形状等特征进行识别,其现在的发展已经比较成熟,并且在计算机中有着广泛的应用;后一部分是脱机手写汉字识别,由于汉字数量繁多、布局复杂、相似字多和风格多变等问题导致汉字识别率仍然较低,并简单说明本研究的主要内容。本研究主要以卷积神经网络为研究基础,介绍了深度学习的相关概念与发展历程和常用方法。第三章为本研究的核心内容,先对基于深度学习的手写汉字识别技术实验进行设计,包括基于深度学习的手写汉字识别的过程设计和系统设计。然后是实验的具体过程,按照设计流程,先搭建实验平台然后确定手写汉字训练数据集和测试数据集,完成实验准备工作。接下来对样本数据图像进行归一化、平滑去噪和仿射变换等预处理,将处理完的样本图像放入以卷积神经网络为基础的LeNet-5结构模型进行学习和训练,在利用TransFlow框架中的多个高级的API进行编程,最后在已搭建好的平台环境进行具体实验,从而实现LeNet-5结构模型的功能得出手写汉字的识别结果,进一步对实验结果进行分析,最后本研究对整个研究进行总结与展望。