手写数字识别系统的设计

来源 :东方教育 | 被引量 : 0次 | 上传用户:yangy1225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着科学技术的高速发展,在统计报表、邮政编码、银行票据等需要处理大量字符信息录入的场所,手写体数字识别系统的需求越来越大,怎样将数字便捷地输入到计算机中已经是计算技术普及的关键问题。此文论述并设计实现了一个手写体数字识别系统。所用的算法是卷积神经网络算法,它也是人工神经网络之中的一个种类,它是人工神经网络与深度学习两种技术相结合后产生的一种全新的更加快速的网络。
  关键词:手写数字识别;卷积神经网络;应用
  手写体数字识别在邮政、金融等领域应用广泛。对于数字识别,人们往往要求识别器有很高的识别可靠性,数字识别的错误所带来的影响比文字识别等其他识别所带来的影响更大,特别是有关金融方面的数字识别错误所带来的后果是无法想象的,识别错一个数字,这其中的差距可能是几的差距,也可能是几十、几百的差距,这些都还是小问题;但更有可能这一个数字代表的差距是几万、几千万甚至几亿乃至更多,那么这个错误造成的损失就无法估量了。因此,設计出有着高可靠性与高识别率的数字识别系统已经成为了字符识别领域一个非常重要的环节。
  1 网络模型和数据库及学习算法的选择
  1.1 关于Mnist数据库的介绍
  首先,Mnist是NIST数据库的一个优化子集。它是一个有着60000个训练样本集与10000个测试样本集的手写体数字数据库。此数字库一共有4个文件。
  此数字库的所有样本集都有图像文件以及标签文件。标签文件的作用是用来储存样本集中的每个样本的数值标签,而每一个样本的图像数据信息则是由图像文件存储着。此数据库的图像数据均保存在二进制文件之中,且每个样本图像的大小均为28*28。
  1.2 数字识别的模型选择
  手写体数字虽然只有0~9十个数字,但由于写法因人而异,不同地域同样一个数字有多种不同的写法,每个人都有自己的书写习惯。且一些纸质差异、笔画粗细、光线问题、位置、尺度大小等等多种因素都能对输入产生影响。考虑到这些因素,为让网络有良好的识别能力,我们这里采用在图像识别领域有着优秀表现的卷积神经网络作为此数字识别系统的训练模型。
  1.3 学习算法的选择
  一个优秀的网络模型必须具备良好的学习算法,每个学习网络都有着相对来说较为合适自己的学习算法,而并不是说越高端的算法就越好。在此文中,我选择的学习算法是较为成熟的BP算法。此算法在文字前面有些许介绍,此处不再多做说明。
  2 基于卷积神经网络的数字识别系统的设计
  2.1 输入层以及输出层设定
  根据样本的特征与此网络的网络结构,可以大概判断出输入层与输出层该如何设置。隐含层的个数可以是一个,也可以是多个,这与要分类的问题有关。
  前文提及到在mnist数据库中,所有的图像都是28*28大小的,且以整个图片的像素形式存储在数据文件之中。每张图像大小为28*28,故一个图片像素点个数为784个。这里,卷积神经网络的输入即为这784个像素点。
  因为数字识别需要识别的是0~9这十个数字,即需要识别十种字符类别,所以将这个神经网络输出层的神经元节点数设置为10。
  2.2 网络的中间层设置
  卷积神经网络的中间层有两个部分,即卷积层(特征提取层)与下采样层(特征映射层),由第二章中图2-1所示,C1、C3为卷积层,S2、S4为降采样层。
  1)激活函数选择
  激活函数选择sigmoid函数。同样,在第二章有所提及。Sigmoid函数是严格递增函数,能较好的平衡线性与非线性之间的行为,比较贴近生物神经元的工作。相比于其他函数,sigmoid函数还存在着许多优势,比如光滑性、鲁棒性以及它的导数可以用它自身来表示。
  sigmoid函数为:
  (1)
  其中,x为神经元净输入。
  激活函数导数为:
  (2)
  2)卷积层设计
  图像经过卷积核对特征图进行卷积,之后再经过sigmoid函数处理在卷积层得到特征映射图。特征映射图相比于原图像,其特征更为明显突出。
  卷积运算其实就是一个加权求和的过程。离散卷积是本文所选取的方法,规定卷积核在水平和竖直两个方向每次都是移动一个像素,即卷积的步长为1。
  3)下采样层的设计
  根据图像局部相关性这一原理,为了降低网络的学习维度、减少需要处理的数据量且保留图像的有用信息,可以对卷积后的图像进行下采样。这里,我们采取的是取卷积层4个像素点平均值为下采样层的一个像素点的方法。这样可以降低网络规模。
  2.3 网络总体结构CNN-0
  根据LeNet-5结构,再结合上文中的对输入层、输出层、中间层的设计,完成了如图3-1所示的基本网络结构:
  相比于LeNet-5,CNN-0做了一些修改,并非完全按照LeNet-5网络结构模型。Sigmoid函数是本网络中的激活函数,选择这个函数的好处在于可以让所有层得到的输出都在区间[-1,1]之内。网络训练的学习率固定值为1或者是衰减的学习速率。经过卷积后的一维向量与输出层没有沿用LeNet-5的径向基函数网络,而是采取全连接方式,省去了F6层。
  3.3 卷积神经网络训练过程
  在模式识别中,学习网络有无指导学习网络与有指导学习网络两个类别。无指导学习网络一般是用来进行聚类分析,本文采取的是有指导学习网络。
  卷积神经网络其实就是从输入到输出的一种映射,它可以学习大量的映射关系,只需要用现有的模式对网络进行训练,网络就能具备映射能力。而不需要输入与输出之间的精确的关系。
  训练算法与传统的BP算法相差无几(BP算法在第二章有做概述),主要可分为四个步骤,而这四个步骤可以归为向前传播阶段与向后传播阶段:相前传播:
  1)随机的从样本集中获取一个样本(A, ),然后将A输入至网络中;
  2)根据公式(3)计算出实际输出:
  (3)
  向后传播:
  1)计算和理想输出之间的差;
  2)根据极小化误差方法调整权值矩阵。
  结语
  在手写数字识别这一块,相对来说比较有难度的应该就是脱机自由手写字符识别了,不过本文所研究的并不是這一系统,本设计是一个基于卷积神经网络的手写数字识别系统,因卷积神经网络的局部感受野和降采样以及权值共享、隐性特征提取等优点,它在图像识别领域得到了非常广泛的应用。此程序是在Caffe这个框架上进行运行的,操作系统为Linux系统ubuntu14.04版本。Caffe是一个开源的深度学习框架,也可以说是一个编程框架或者模板框架,它提供一套编程机制。因此,本文所需要实际的卷积神经网络就可以根据这个框架来进行构建。
  参考文献:
  [1]张伟,王克俭,秦臻.基于神经网络的数字识别的研究[J].微电子学与计算,2006年第23卷第8期.
  [2]国刚,王毅.应用BP神经网络进行手写体字母数字识别[J].电脑知识与技术,2008.
  [3]王鹏.基于神经网络的手写体字符识别[D]:[硕士学位论文].北京:北京工业大学,2002.
其他文献
小学语文是一门重要的学科,同样也是牧区小学的重要学科,是每一位牧区学习者交际的必备工具,更是学习做人处世的基石。对于一位牧区小学语文教师来说,在具备广博的社会知识的同时,还需具备人格魅力和人文素养。在小学语文阅读教学中,语文教师应如何进行教学呢?在牧区小学语文阅读教学中,我认为语文教师应可以通过以下四种方法:一、以读为本,二、边读边写,三、读后精讲,四、在课堂教学中组织语言表达训练,五、开设阅读课
期刊
摘要:随着新课改的逐渐深入,小学生不但需要熟练掌握拼音读法,还要对文章有一定的情景体验,对文章有一个进一步的理解。作为最基本的教学方法,语文阅读教学发挥着至关重要的作用。但是在实际教学过程中,部分老师并没有真正理解语文阅读教学的重要作用,并没有让语文阅读教学得到实际的应用,导致我国的小学基础教育水平始终处于落后阶段。因此,对小学语文阅读教学的实际应用进行一个详细系统的分析就显得尤为重要。  关键词
期刊
哲人詹姆士曾经说过“人类本质中最殷切的要求是渴望被肯定。”被肯定就是得到赏识。所谓赏识教育就是通过激励表扬手段,肯定学生的优点、长处,让学生树立信心,鼓励他不断追求成功。从本质上就是说,赏识激励成功,赏识挖掘潜力。  随着社会的飞速发展,我国传统的教育与社会对人才的需求之间的矛盾日益突出,因此教育体制改革被提上了日程.新课程中指出教育的使命和教师的任务是让学生从小有良好的心态,学会自信,学会欣赏自
期刊
摘要:在农村小学,由于客观原因及一些物质条件的限制,学生的阅读能力比较低下,引起了大家的重视。农村小学生的英语阅读能力的培养,也是当今英语教学的一个热点话题。因此,我们从小就指导学生养成良好的阅读习惯,从而培养学生的阅读能力,具有重要的意义。本文结合农村英语教学实际,着重探讨了农村小学生英语阅读能力的培养。  关键词:英语阅读;阅读能力;阅读习惯  现在农村大部分学生远不及城市学生的英语学习水平,
期刊
摘要:不断深化的教育体制改革,日渐突显出小学语文阅读教学的重要地位,对小学语文教师而言,当务之急便是要积极思考怎样促进阅读教学高效性与有效性的提高,对学生的思考能力、实践能力予以锻炼,让学生产生浓厚的学习兴趣,进而更好的理解与把握教材知识。本文笔者结合自身教学实践,就合作学习在小学语文阅读教学中运用的重要性展开了简要论述,重点探讨了合作学习在小学语文阅读教学中的具体运用,旨在促进小学语文阅读教学效
期刊
初中数学是初中生学习的重点科目之一,也是教学大纲中的重点难点的教学任务。目前初中学生的数学学习中普遍存在着成绩提高难、成绩提高慢的现象,究其原因与学生的学习动力不足和学习效率偏低有一定的关系。因此,作为初中数学教师,在教学思想中要弃糟粕、取精化,培养自己独特的教学素养,为提高学生的学习效率提供切实可行的教学方法。我在学生的数学课堂上巧妙地融入了综合与实践活动,旨在提高学生的数学学习能力、强化学生的
期刊
摘要:谈到马蒂斯,我觉得他忠实于对物象的描绘而其所寻求的却是主观艺术真实的理论,更是在形体上吸收了印象派反对再现的绘画理论,在其基础上大胆地叛逆,表述了他的表现主义理论。在我看来他根植于“艺术是一种装饰”的绘画理念,展现物象的自然本质,一生追求平衡,纯粹与宁静的画论思想。而马蒂斯则把绘画比作“安乐椅”,以此来消除他人疲劳供人赏心悦目。他说,[“我所梦寐以求的是一种平衡,纯洁,宁静,不含有使人不安或
期刊
摘要:脱落酸作为一种植物内源激素,在植物应对非生物胁迫及调控方面发挥了非常重要的作用。本文综述了ABA在调控植物在应对干旱胁迫、低温胁迫和盐胁迫中的作用及其研究进展。  关键词:脱落酸;植物逆境胁迫;干旱胁迫;低温胁迫;盐胁迫  脱落酸(Abscisic acid,ABA)是上世纪60年代发现和鉴定出的一种植物内源激素, 以异戊二烯为基本单位组成的倍半萜羧酸。自从脱落酸被分离和鉴定之后,其生理功能
期刊
我国电视剧制播体制是由电视剧产业体系中制作与播出两大重要环节相互作用影响形成的运行机制,是制播环节中生产关系和资源配置方式的主要实现形式。由于电视剧系统的内在运作规律,决定了电视剧制播模式的演变既是我国广播电视体制改革的剪影,又同时对每个阶段电视剧产业的发展产生不可小觑的影响。电视剧的制播程序包括:制作(选择剧本、剧情编辑、投入拍摄、后期制作)、营销、发行、播出等环节。  新媒体是新的技术支撑体系
期刊
摘要:随着计算机科学技术的迅速发展,计算机网络通讯技术的应用,已经渗透到了人们生活的各个方面,除了满足人们远程交流需要外,还在网购、电子货币流通等方面起到了重大的作用,极大的方便了人们的生活。  关键词:计算机;远程网络;通讯技术  近些年来,计算机网络覆盖的区域迅速扩张,网络技术也不断更新。远程网络通讯技术可以跨越时间和空间的阻隔传递信息,因为其拥有的巨大通讯优势不断得到开发,并应用到了各行各业
期刊