论文部分内容阅读
21世纪是一个大数据时代,以计算机为载体的数字化信息在世界各个角落传播。传统的人工数据录入工作效率低、耗费人力财力,为了将计算机办公与数据录入有机结合,手写体数字识别技术提供了一种有效的手段。手写体数字识别由于其自身结构特点存在诸多问题,无论在技术领域还是应用领域仍值得我们研究探索。深度学习(Deep Learning)是机器学习领域里最大的浪潮,是一种包含多个隐藏处理层的深层次网状结构计算模型,通过对数据的特征学习来获得数据的多抽象层表示。近年来大规模数据集的出现以及高性能计算机硬件的发展对深度学习研究起到了至关重要的作用,随之深度学习在计算机视觉处理、自然语言处理以及语音识别等诸多方面得到了应用。本文首先介绍神经网络的相关理论知识和优化方法,主要包括神经元模型、多层感知器、BP神经网络、局部感知、下采样、权值共享、卷积操作、激活函数、池化、Softmax回归、批量归一化、正则化等。分析采用深度神经网络模型做手写体数字识别研究时容易产生过拟合的问题,并提出解决方案。针对数据集较少时容易导致过拟合的问题,本文采用数据增强的解决方案。解决方案中介绍生成式对抗网络的相关理论知识,包括生成器和判别器,据此设计深度卷积生成对抗网络做数据增强,并提出相应网络优化方法。通过实验将该方法与传统数据增强方法作对比,实验结果表明生成式数据对模型性能提升效果优于传统方法,数据增强有效提高了模型的性能。接着分析了采用深度神经网络模型做手写体数字识别时极易出现梯度消失和爆炸的问题。针对梯度消失和爆炸问题本文采用在深度神经网络中加入残差模块的解决方案。方案中主要介绍残差网络的相关理论知识,包括短连接和卷积层分叉思想,通过改变残差块卷积层宽度、引入批量归一化和添加Dropout层搭建网络模型并完成训练,有效避免了梯度消失和爆炸的情况,同时提升了模型学习效率。通过实验分析Batch Size、学习率和Dropout值对网络性能的影响,确定了一个性能较好的识别模型,该模型相较于传统卷积神经网络模型在识别率上有较大提升,同时具有更强的鲁棒性。本文最后展示了一个简易的手写体数字识别系统,该系统完成了数据输入、网络预测、识别结果输出的功能。实验表明,设计的简易识别系统具有较高的识别率。