论文部分内容阅读
图像识别技术在诸多领域发挥着重要作用,广泛应用在机器视觉、医学影像、遥感图像以及智能交通等多个领域。对于手写体数字序列的识别,研究领域属于图像识别技术。企业或高校做与图像识别方向有关的课题时,多少都会涉及到手写体数字识别技术。手写体数字序列的识别在人们的日常生活中应用很广。因此,若手写体数字序列的识别精度和速度进一步提高,能更好的改善工作效率。传统数字识别方法中数字特征的提取依靠人工参与,识别算法速度慢、精度低。然而深度学习模型中的数字特征不再需要人工提取,模型能以更快的速度实现,并具有更高的精度。这使得深度学习成为目前最热门的研究算法之一。本文采用深度学习方法,自行设计一套识别手写体数字序列的系统,并将其应用到实际比赛中。论文首先描述了该课题的研究背景,介绍了手写体数字识别技术在国内外的发展现状,并对机器学习技术作了简单介绍。然后介绍近年来用于手写体数字序列识别的经典方法,并针对本文重点研究内容——基于深度学习的手写体数字序列的识别研究,重点介绍深度学习算法。给出了深度学习的基本思想,并探讨了基于卷积神经网络的深度学习模型的结构及训练过程。论文重点研究了以Caffe作为框架的深度学习模型,讲解包括Caffe相对其他框架的特点、Caffe的核心模块和基本层级结构。讲解了作为卷积神经网络最为经典的模型Lenet-5,并在它的基础上进行改进研究,设计得到一个九层的神经网络模型Lenet-improve,并通过测试论证了改进模型识别准确率进一步提高的有效性。论文最后针对于实际应用需求,给出了Linux系统的安装及caffe在Linux下的安装配置以及系统的整体架构的详细设计过程,并且给出了详细的数字图像预处理过程,实现了利用mnist进行手写体数字序列的识别过程。最后,通过实际比赛中的视频资料对设计的系统进行试验,结果表明该系统对于手写数字序列的识别具有较高的准确率。